阿里Qwen3横空出世!2350亿参数混合模型全面超越Llama4,支持119种语言可开关'思考模式'
2025-04-29
阿里开源Qwen3系列混合推理模型,包括旗舰Qwen3-235B-A22B和Qwen3-30B-A3B,参数量覆盖0.6B至235B。模型在代码、数学推理等关键领域超越Llama 4等竞品,支持119种语言,引入可切换思考模式提升效率。训练数据量达36万亿token,采用MoE架构优化成本,后训练流程包含蒸馏等技术。开源权重并提供多平台部署支持。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
