Skip to content

微软Azure智能语音合成全面升级到48kHz高保真模型

微软Azure智能语音合成全面升级到48kHz高保真模型

IT之家 11月17日消息,微软Azure神经网络文本转语音服务(又称“Neural TTS”,“智能语音合成”)能帮助用户将文本转换为逼真的人工智能声音,它适用于多种应用场景,包括智能语音助手、客服对话机器人、有声内容朗读、游戏角色语音等。在过去的几个月中,微软Azure智能语音合成技术在语音自然度、声音丰富度和多语言支持等方面取得了快速进展。

今天微软官方为大家带来了最新的神经网络语音合成声码器HiFiNet2。

声码器是TTS中的关键组件之一,它基于输入的文本或声学特征来合成音频样本。目前,通过HiFiNet2声码器技术,微软已经将微软Azure智能语音合成产品全面升级到48kHz声音模型,进一步为用户带来更高保真、高效率和可扩展的AI语音音质体验。这项更新包括400多个音色,覆盖全球超过140个国家和地区的语言。

48kHz语音模型

在文本转语音技术中,音频的保真度是用来衡量音质的一项重要标准。高保真声音不但可以给用户传达更丰富、更细腻的音质,同时还可以将音色的失真和变形降至最低。随着采样率的提升,听众可以听到更精准的细节和更真实的音色。在视频配音、游戏和唱歌等需要更精细、更沉浸的声音体验的复杂场景中,更高保真度的输出(如48kHz采样率)将给用户带去前所未有的全新感官体验。

现在,随着Azure深度神经网络语音合成服务将全平台AI声音升级到48kHz采样率,微软率先在业界为AI声音用户带来真正高保真度的声音体验。

相关推荐: 跨境电商一周猛料:2019第一季度财报喜忧参半,拼多多首登美国“恶名市场”名单

【编者按】本周(4月22日-4月26日),跨境电商行业又有哪些市场商机和资讯趣闻呢?亚马逊推出创始卖家计划;阿里巴巴再次被美国列入“恶名市场”黑名单;泽汇科技88.5714%的股权被收购;各大平台公布Q1财报……更多猛料资讯,可继续下拉,阅读全文获取! 起步股…

    码刀科技(www.lekshop.cn)是国内知名企业级电商平台提供商,为企业级商家提供最佳的电商平台搭建(多种模式电商平台搭建:B2B/B2B2C/B2C/O2O/新零售/跨境等)、平台管理系统开发及互联网采购解决方案服务, 联系客服了解更多.

    电子商务网站建设的重要性和好处