
只要上传3秒音频配资门户官方平台,AI就能让你的声音以母语者的发音水平,声情并茂地流利说出14种语言。这不是科幻电影里的桥段,而是一款“王炸级”国产开源TTS模型的真实能力。近日,据南方+记者从网易有道方面了解到,网易有道「子曰4.0」TTS语音合成引擎Confucius4-TTS 已经正式发布。据介绍,这是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移和本地化部署等关键维度上达到国际最前沿水平,为多语种内容生成、数字人配音、跨语言教学、短剧出海和全球化传播提供了更低门槛的国产化技术底座,现已面向全球用户全量开源。

据悉,目前网易有道Confucius4-TTS已全面支持中文、英语、西班牙语、法语、德语、韩语、泰语、越南语等14种语言的自然流利表达。其核心优势在于通过单段音频输入,模型即可捕捉原声特质,并将其转化为任意目标语言输出,且发音地道自然,彻底消除跨语种合成中常见的违和口音。更关键的是,模型还能自动提取参考音频里的情感特征——你生气地说一句话,合成出来的外语也是生气的语气,语调、韵律、情绪完整迁移。
值得关注的是,网易有道已将该模型全量开源。Confucius4-TTS采用Apache开源协议,面向全球开发者开放完整模型权重和配套工具链,商用没有限制。开发者可以下载54G完整资源包,本地离线部署运行。正如业内开发者所评价:“此次开源提供了完整的模型权重而非仅仅开放API,54GB的资源包支持本地离线运行,为口播配音、数字人等应用场景提供了极具性价比的高效解决方案。”

在业内人士看来,Confucius4-TTS 在众多场景中都具备应用的价值。其中在跨境内容赛道,短视频、短剧创作者只需录制一次原声,就能批量生成14国语言配音,一个人就能完成多语种海外内容制作。数字人行业可以统一虚拟主播的音色,不用为不同语种重新录制声线,大幅降低制作成本。智慧教育领域能生成地道的多语种发音素材,打造多语种AI外教。出海企业和文旅机构可快速完成多语种语音播报和品牌宣传片的本地化配音。
网易有道表示,希望通过全量开源Confucius4-TTS,降低语音克隆和情感合成的门槛,让每一个声音都能跨越语言的边界,让中国AI声音真正走向世界。目前,Confucius4-TTS已在GitHub面向全球开发者开源,开发者可直接下载模型权重,本地离线部署,商用无限制。
南方+记者 叶丹配资门户官方平台
启泰网提示:文章来自网络,不代表本站观点。