优刻得携手声智科技跨语种翻译实现音色情感双还原-中新社上海

　　中新网上海新闻11月21日电(范宇斌)AI语音翻译已经走进生活场景，但明显的“AI腔”往往让对话显得生硬。想象一下，若翻译能用“自己的声音”呈现，跨语言交流就能像说母语一样自在、顺畅。

　　如今，这样丝滑的沟通体验已经成为现实。在优刻得全球智算云底座的强力支撑下，声智科技的AI耳机率先将“跨语种音色与情感复刻技术”应用于实时翻译场景，让对话不仅“听得清、翻得准”，更能“听着像自己、说得有情感”。让跨语言交流变得自然、真实、亲切，真正实现沉浸式沟通体验。

　　声智科技的AI声音技术，不仅关注内容的准确翻译，更致力于复刻说话者的真实音色和情绪，在翻译的同时生成与说话者一致的音色效果，让跨语种沟通如同母语交流般自然流畅。

　　高度还原自然音色：声智AI声音模型已达到SIM-O音色相似度0.73的行业顶尖水平，MOS自然度评分4.01，几乎等同于说话者真实音色的听感。这意味着用户在使用翻译功能时，听到的不仅仅是准确的内容，更是对方带有独特声线和情绪表达的“声音”，极大地拉近了交流距离。

　　内容还原与准确率：在内容准确性上，声智AI模型的表现同样出色，词错率WER低至1.58%。在国际通用的LibriSpeech数据集对比中，声智的内容准确率超越了VALL-E2、VoiceBox等国际顶尖模型。

　　声智科技成功实现了在真实应用环境下“音色复刻如临其境，内容还原分毫不差”的技术效果，并实现不同语言间的音色一致性重构。无论用户讲中文、英语、法语或日语，AI都能以相同的音色完成跨语种实时播报，在国际会议、跨境通话、在线教学等各类场景中，可以“自己的声音”完成全球沟通。

　　依托优刻得覆盖全球22个地域、30大可用区的智算节点，声智科技AI生态已服务数百万用户，其AI耳机正在重塑智能听觉体验。优刻得提供的高性能算力、低时延网络和稳定的推理加速能力，为声智的语音识别、情感建模与音色复刻等核心技术提供可靠支撑，让跨语言沟通更加自然顺畅。

　　用户不仅依赖声智AI高效、精准的实时翻译，更能够在跨语言交流中保留了“自己的声音”，交流双方可以用各自真实的音色传递情感。使用者反馈表示，这种“带着自己声音”的跨语种沟通方式，让交流更自然、更亲切，也显著提升了对话中的信任感。

　　在优刻得的智算云底座赋能下，声智科技持续引领智能听觉技术的创新与应用。无论是商务谈判中希望保持专业而熟悉的语调，还是朋友间交流时渴望听到对方带有个性的声音，声智的音色复刻技术都完美满足了需求。通过双方在算力、算法与AI产品化上的深度协同，让全球沟通不再有语言和声音的隔阂，真正实现“听觉自由”。(完)

注：请在转载文章内容时务必注明出处!

编辑：李秋莹