语音技术再突破！智源开源原生全双工大模型，边听边说低延迟交互成现实

2025-09-25

北京智源人工智能研究院联合Spin Matrix与新加坡南洋理工大学发布RoboBrain—Audio原生全双工语音对话大模型，采用原生全双工架构，相比传统TDM模型响应延迟更低、对话更自然，仅用100万小时（业界1%）数据训练即满足日常交互需求，模型与代码已开源。该模型通过“自然独白对齐”和“双训练范式”实现技术突破，可边听边说，适配具身场景，是智源RoboBrain系列面向具身智能的关键能力载体，将推动语音交互与具身感知、规划等能力结合，加速机器人等场景语音服务应用。

查看完整舆情解析

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表希财网官方立场，不构成投资建议。如需阅读详细说明，请点击此处

语音技术再突破！智源开源原生全双工大模型，边听边说低延迟交互成现实

理财有风险，投资需谨慎