首页
知识
理财
保险
股票
基金
贷款
信用卡
百科
问答
问答
视频
产品
贷款导航
选保险
舆情宝
笔记
顾问入驻
希财
>
舆情宝
>
舆情列表页
舆情评分
舆情评分
正面舆情
负面舆情
中性舆情
舆情等级
舆情等级
紧急
重要
一般
舆情分类
舆情分类
新闻
公告
重要 ● 负面 ● 新闻
2025-06-11 15:07:05
多模态AI空间智能大考:多数模型不及格,o3仅41%正确率
MMSI-Bench是由多家高校及实验室联合开发的多图像空间智能评测基准,针对多模态大模型在空间推理能力上的短板进行测试...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-06-09 09:26:29
视频生成大模型商业化面临'最后一公里'挑战,专家称需构建生态突破瓶颈
视频生成大模型商业化面临技术瓶颈与路径选择难题。智象未来CEO梅涛指出,当前视频生成模型在叙事性、稳定性和可控性上尚未突...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-06-04 14:46:18
GPT-4o验证码挑战大崩盘!多模态AI真实场景短板被曝光
MetaAgentX团队推出Open CaptchaWorld平台,测试多模态AI模型解决验证码能力。结果显示,人类平均...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-29 17:27:36
多模态AI视频推理大考全军覆没!腾讯新测试暴露技术短板
腾讯ARC Lab和香港城市大学推出新的视频推理Benchmark——Video-Holmes,测试结果显示所有多模态大...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-29 10:40:45
AI连电路图都看不明白?新测试暴击多模态模型准确率不足55%
SeePhys团队联合推出多模态物理推理新基准,测试显示顶尖AI模型在处理物理图表与理论结合的任务中准确率不足55%。该...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-28 09:46:43
多模态AI物理推理能力大考:头部模型集体不及格,人类仍占绝对优势
PhyX团队发布首个针对多模态大模型物理推理能力的基准测试,结果显示包括GPT-4o mini在内的16个主流模型在物理...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-23 17:11:21
多模态AI长文本理解大考:46款模型集体‘挂科’
MMLongBench团队发布首个多模态长文本理解测评,对46款领先模型进行基准测试。结果显示所有模型在处理128K长度...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-23 10:11:56
达摩院新基准亮剑:多模态大模型数学题集体‘不及格’
达摩院推出新基准VCBench,专门评估多模态AI模型在依赖视觉的小学数学题上的推理能力。测试显示,包括Qwen-VL-...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-20 13:30:47
多模态AI暴露致命缺陷!EMMA基准测试揭示顶尖模型推理能力落后人类20%
ICML 2025接收的EMMA基准研究显示,当前多模态大语言模型在跨模态推理能力上存在显著短板。在数学、物理等需要视觉...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-07 10:12:17
阿里通义核心人才出走!多模态AI领军人物跳槽大厂,或加剧行业技术博弈
阿里巴巴通义实验室应用视觉团队负责人薄列峰(P10职级)于4月30日离职,目前在美国西雅图加入某互联网大厂担任多模态模型...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-05-06 16:11:22
阿里通义实验室再失大将!多模态AI领军人物薄列峰离职赴美
阿里通义实验室应用视觉团队负责人薄列峰(P10职级)于4月30日离职,此前带领团队开发出通义App爆款功能如「兵马俑跳科...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-04-30 12:03:19
多模态AI大考不及格!头部产品总分不足40,复杂任务成最大绊脚石
SuperCLUE发布中文通用AI智能体测评基准AgentCLUE—General,测评8款国内外产品。结果显示,最高分...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-04-29 11:54:34
AI四小龙集体亏损超500亿 多模态赛道转型遇阻引关注
AI四小龙(商汤、云从、依图、旷视)面临巨额亏损、裁员降薪及转型阵痛。商汤2024年净亏损43.06亿元,云从营收同比下...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-04-25 10:03:24
强化学习真能让AI推理能力突破基座限制吗?清华研究提出新质疑
清华大学与上海交通大学的研究指出,当前基于RLVR的强化学习训练并未突破大模型基座的能力上限。通过数学、代码、视觉推理等...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-04-17 17:11:55
重磅测试结果曝光!多模态AI视频推理集体不及格,最强模型也仅62分
中科大等团队提出VCR-Bench评估基准,测试多模态模型在视频CoT推理能力的表现。结果显示最优模型O1仅获62.8分...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-04-15 14:27:06
AI时空智能大考不及格,多模态模型集体翻车
上海交通大学联合多机构推出STI-Bench评测基准,测试多模态大模型在时空智能领域的表现。结果显示,包括Gemini、...
点击查看详情 >
紧急 ● 负面 ● 新闻
2025-04-07 21:21:42
Meta Llama 4被曝训练作弊引发信任崩塌 开源旗手遭遇滑铁卢
Meta最新发布的Llama 4多模态AI模型被曝训练数据作弊,实测表现严重不如预期。用户测试显示其编程能力垫底、长文本...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-03-31 23:02:05
训练越多反而越差?多模态AI模型或迎研发范式转折点
美国多所大学的研究团队发现'灾难性过度训练'现象:过量预训练数据反而导致模型性能下降。实验显示当LLM预训练token超...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-03-18 17:09:38
百川医疗战略受阻 华为入局加剧行业竞争
百川智能为应对行业竞争及融资压力,多次调整战略,从B端业务转向聚焦医疗领域,但面临华为入局、多模态研发缓慢、医疗商业化落...
点击查看详情 >
重要 ● 负面 ● 新闻
2025-03-14 21:27:49
阿里AI核心专家离职,技术持续发力
阿里通义实验室语音团队负责人鄢志杰离职,作为顶尖AI专家,其去向引发行业猜测。尽管团队核心成员变动,但实验室已推出多项多...
点击查看详情 >
加载更多
暂无内容
扫二维码绑定公众号
重要舆情微信推送提醒