希财 > 舆情宝 > 舆情详情页

多模态AI视频推理大考全军覆没！腾讯新测试暴露技术短板

2025-05-29

腾讯ARC Lab和香港城市大学推出新的视频推理Benchmark——Video-Holmes，测试结果显示所有多模态大模型在复杂视频推理任务中表现不及格，准确率普遍低于50%。该Benchmark通过设计需整合多线索的推理问题（如分析凶案动机、时间因果等），暴露了现有模型在逻辑串联线索和关键信息提取上的不足。尽管部分推理专用模型表现稍优，但整体技术瓶颈明显。测试数据、代码及论文已开源，为行业提供了一个评估复杂推理能力的新工具。

查看完整舆情解析

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表希财网官方立场，不构成投资建议。如需阅读详细说明，请点击此处

扫码体验舆情宝小程序 99%的用户都在用

理财有风险，投资需谨慎

风险提示：希财网作为财金知识服务平台进行信息发布，不对任何投资人及/或任何交易提供任何担保，无论是明示、默示或法定的。希财网提供的各种信息及资料（包括但不限于文字、数据、图表及超链接）仅供参考（如：历史或预期收益不代表实际收益），不作为任何法律文件，亦不构成任何邀约、投资建议或承诺，投资人应依其独立判断做出决策。投资人据此进行投资交易而产生的风险等后果请自行承担，希财网不承担任何责任。

信息来源：本文中引用的各种信息及资料（包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主体（包括但不限于公司、媒体、协会等机构）的官方网站或公开发表的信息。

希财网版权所有 © 2014-2024 湘ICP备10026015号增值电信业务经营许可证湘B2-20070093 湘公网安备43019002000662号

广播电视节目制作经营许可证(湘)字第00319号工商营业执照信息

违法和不良信息举报举报电话：0731-85127885 举报邮箱：tousu@csai.cn