中文通用AI智能体首测结果出炉:整体能力基础,复杂任务成短板,Manus暂居榜首
2025-04-30
AgentCLUE—General首次测评结果显示,参评的8款AI智能体整体能力处于基础阶段,最高分ManusStarter仅38.46分。复杂多步骤任务(Level 3)得分率不足35%,多模态理解和多场景组合能力显著薄弱。测评指出当前智能体在处理非结构化数据、视频音频等多模态信息时表现极差,且组合任务失败率高。测评计划5月27日发布第二阶段结果,持续追踪技术迭代。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
