多模态AI推理链延长致幻觉增多,技术瓶颈亟待突破
2025-07-07

多
多模态AI
正面
查看报告
斯坦福大学等机构的研究指出,多模态大模型(MLLMs)在生成更长推理链时反而产生更多幻觉。研究发现,随着推理链变长,模型对视觉输入的关注减少,转而依赖语言先验,导致跨模态语义失配。问题根源包括视觉编码器与语言模型的不平衡、视觉特征压缩导致的注意力漂移,以及训练机制无法约束跨模态一致性。解决方案方向包括改进视觉编码器结构、优化跨模态接口设计和引入更有效的训练损失函数。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
