大模型全军覆没,中科院自动化所推出多图数学推理新基准
2025-03-12
中国科学院自动化研究所推出多图数学推理数据集MV—MATH,旨在评估MLLM在多视觉场景中的数学推理能力。实验结果显示,包括GPT-4在内的多个大模型表现不佳,所有模型均未及格,表明MLLM在复杂多视觉感知与图像交叉理解上仍存在显著挑战。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表123彩票app稳定版下载
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
