AI连电路图都看不明白?新测试暴击多模态模型准确率不足55%
2025-05-29
SeePhys团队联合推出多模态物理推理新基准,测试显示顶尖AI模型在处理物理图表与理论结合的任务中准确率不足55%。该基准覆盖初中至博士阶段的2000道物理题,涉及电路图、费曼图等21类图表,暴露出当前多模态模型在视觉-文本对齐、特定图表识别及逻辑推理上的系统性缺陷。实验表明,即使SOTA模型如Gemini、o4-mini在视觉信息密集任务中表现疲软,且存在建模错误、过度简化等9类典型失误。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
