这届出题太难了!新基准让多模态模型集体自闭,GPT—4o都是零分
2025-02-18
ZeroBench是一个针对多模态模型的高难度视觉基准测试,包含100个复杂问题,涉及多步骤推理和广泛的知识领域。20多个知名AI模型在首次测试中全部得零分,显示当前多模态模型的能力与ZeroBench的难度之间存在显著差距。研究团队通过多轮筛选和调整,确保了问题的挑战性。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表123彩票app稳定版下载
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
