语音技术再突破!智源开源原生全双工大模型,边听边说低延迟交互成现实
2025-09-25

语
语音技术
正面
查看报告
北京智源人工智能研究院联合Spin Matrix与新加坡南洋理工大学发布RoboBrain—Audio原生全双工语音对话大模型,采用原生全双工架构,相比传统TDM模型响应延迟更低、对话更自然,仅用100万小时(业界1%)数据训练即满足日常交互需求,模型与代码已开源。该模型通过“自然独白对齐”和“双训练范式”实现技术突破,可边听边说,适配具身场景,是智源RoboBrain系列面向具身智能的关键能力载体,将推动语音交互与具身感知、规划等能力结合,加速机器人等场景语音服务应用。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
