港中文MMLab突破多模态数学推理瓶颈,MINT-CoT模型准确率暴涨32%
2025-06-16
香港中文大学MMLab团队发布MINT-CoT模型,解决多模态数学推理三大瓶颈:细粒度视觉区域选择、数学图像感知不足、对外部工具依赖。该模型通过动态选取视觉token与文本联合推理,在MathVista等数据集准确率提升32.59%至23.2%,超越现有SOTA模型。团队还构建了5.4万条专属训练数据集,并采用三阶段训练策略逐步提升推理能力。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
