中新网上海新闻11月21日电(范宇斌)AI语音翻译已经走进生活场景,但明显的“AI腔”往往让对话显得生硬。想象一下,若翻译能用“自己的声音”呈现,跨语言交流就能像说母语一样自在、顺畅。
如今,这样丝滑的沟通体验已经成为现实。在优刻得全球智算云底座的强力支撑下,声智科技的AI耳机率先将“跨语种音色与情感复刻技术”应用于实时翻译场景,让对话不仅“听得清、翻得准”,更能“听着像自己、说得有情感”。让跨语言交流变得自然、真实、亲切,真正实现沉浸式沟通体验。
声智科技的AI声音技术,不仅关注内容的准确翻译,更致力于复刻说话者的真实音色和情绪,在翻译的同时生成与说话者一致的音色效果,让跨语种沟通如同母语交流般自然流畅。
高度还原自然音色:声智AI声音模型已达到SIM-O音色相似度0.73的行业顶尖水平,MOS自然度评分4.01,几乎等同于说话者真实音色的听感。这意味着用户在使用翻译功能时,听到的不仅仅是准确的内容,更是对方带有独特声线和情绪表达的“声音”,极大地拉近了交流距离。
内容还原与准确率:在内容准确性上,声智AI模型的表现同样出色,词错率WER低至1.58%。在国际通用的LibriSpeech数据集对比中,声智的内容准确率超越了VALL-E2、VoiceBox等国际顶尖模型。

声智科技成功实现了在真实应用环境下“音色复刻如临其境,内容还原分毫不差”的技术效果,并实现不同语言间的音色一致性重构。无论用户讲中文、英语、法语或日语,AI都能以相同的音色完成跨语种实时播报,在国际会议、跨境通话、在线教学等各类场景中,可以“自己的声音”完成全球沟通。
依托优刻得覆盖全球22个地域、30大可用区的智算节点,声智科技AI生态已服务数百万用户,其AI耳机正在重塑智能听觉体验。优刻得提供的高性能算力、低时延网络和稳定的推理加速能力,为声智的语音识别、情感建模与音色复刻等核心技术提供可靠支撑,让跨语言沟通更加自然顺畅。
用户不仅依赖声智AI高效、精准的实时翻译,更能够在跨语言交流中保留了“自己的声音”,交流双方可以用各自真实的音色传递情感。使用者反馈表示,这种“带着自己声音”的跨语种沟通方式,让交流更自然、更亲切,也显著提升了对话中的信任感。
在优刻得的智算云底座赋能下,声智科技持续引领智能听觉技术的创新与应用。无论是商务谈判中希望保持专业而熟悉的语调,还是朋友间交流时渴望听到对方带有个性的声音,声智的音色复刻技术都完美满足了需求。通过双方在算力、算法与AI产品化上的深度协同,让全球沟通不再有语言和声音的隔阂,真正实现“听觉自由”。(完)
注:请在转载文章内容时务必注明出处!
编辑:李秋莹






