南洋理工新测试揭示多模态AI短板:GPT—4o视频理解正确率仅36%
2025-08-01

多
多模态AI
正面
查看报告
南洋理工大团队提出Video—TT测试基准,评估视频大型语言模型的真实理解能力。结果显示,GPT—4o在视频理解正确率仅36.6%,远低于人类的84.3%。研究指出当前多模态模型存在三大缺陷:时空关系处理能力差、缺乏常识推理、复杂情节理解不足。测试表明AI在视频思维的准确性和鲁棒性上与人类差距显著,尤其在需要深度推理的任务中表现薄弱。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
