B站开源IndexTTS—2.0!语音技术突破时长与情感双控难题,助力内容全球化
2025-09-18

语
语音技术
正面
查看报告
哔哩哔哩Index团队开源最新文本转语音模型IndexTTS—2.0,该模型创新性提出“时间编码”机制,解决传统自回归(AR)模型难以精确控制语音时长的难题,同时实现音色与情感的解耦建模,支持多模态情绪控制(如通过音频参考、文本描述等方式控制情感)及跨语种合成,在多个测试集上性能超越现有SOTA模型。目前模型在Github已超10k stars,其技术突破显著提升AI配音、视频翻译等下游场景可用性,尤其为B站优质内容出海提供关键技术支持,降低高质量内容跨语言传播门槛,标志零样本TTS进入“情感可控 时长精确”双维度时代。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
