小红书团队发布FireRedTTS—2,语音对话合成技术实现行业领先突破
2025-09-15

语
语音技术
正面
查看报告
小红书智创音频技术团队发布新一代对话合成模型FireRedTTS—2,针对现有方案灵活性差、发音错误多、说话人切换不稳、韵律不自然等痛点,通过升级离散语音编码器(低帧率、语义信息丰富、支持流式解码)与文本语音合成模型(支持逐句生成、双Transformer架构)全面优化合成效果。该模型在主客观测评中优于MoonCast、ZipVoice—Dialogue等开源系统,支持多语言(中、英、日等)及音色克隆(仅需一句语音样本即可模仿音色与说话习惯),为AI播客等对话合成应用提供工业级解决方案,同时可作为高效工具生成高质量音频数据。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
