多模态AI暴露致命缺陷!EMMA基准测试揭示顶尖模型推理能力落后人类20%
2025-05-20
ICML 2025接收的EMMA基准研究显示,当前多模态大语言模型在跨模态推理能力上存在显著短板。在数学、物理等需要视觉与文本深度融合的复杂推理任务中,GPT-4o、Gemini等顶尖模型表现落后人类专家超20%,核心瓶颈在于视觉空间想象与多模态信息整合能力不足。研究发现思维链提示和计算扩展策略无法根本改善视觉推理缺陷,揭示出现有技术架构难以实现真正的跨模态动态协作。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
