中新网上海新闻5月16日电(郑莹莹)MiniMax近日发布新一代语音大模型Speech-02,并在国际知名语音评测榜单Artificial Analysis和Hugging Face TTS Arena上,力压国际知名企业的模型,荣登双榜榜首。
据介绍,Speech-02在语音模型核心技术指标:字错率WER和相似度SIM等客观指标上取得了SOTA结果(即:领域当前领先水平),用户盲听主观评价反馈也更自然、真实。

Speech-02为用户带来超拟人、个性化、多样性的语音服务。比如 Speech-02通过“声音参考”功能,对任意给定语音实现灵活控制,进行感情、语速、音高、语种等无缝切换。它甚至在同一段语音里也可以实现多个语种间的切换。
值得关注的是,Speech-02 拥有高性能和性价比双重优势,性能登顶同时其商用定价仅为全球某知名头部语音模型的四分之一。
目前,MiniMax已在文旅导览、金融服务、语音助手、AI教育等应用服务领域;AI玩具、教育学习机、汽车智能座舱等硬件场景,形成相应的解决方案,并与国内外多家知名企业达成深度合作。
“技术突破+商业落地”的双轮驱动模式,助力中国国产大模型在全球AI竞赛中跑出速度。据MiniMax海外生态负责人Linda介绍,这次发布的Speech-02能够驾驭32个语种的不同口音和不同情绪。“在海外,我们已支持大量内容创作者,通过低门槛的语音工具,用自己的声音灵活接单,为广告、短片进行声音表演,赋能零工经济。”Linda说。(完)
注:请在转载文章内容时务必注明出处!
编辑:李秋莹