A前瞻官网
前瞻网
a 当前位置: 前瞻网 » 资讯 » 产经

业内首家!快手实现基于深度学习的实时变声直播,自然度高且表现稳定

分享到:
 Evelyn Zhang • 2021-05-17 17:13:27 来源:前瞻网 E9026G0
100大行业全景图谱

在主流直播平台上,主播往往需要一些趣味性强的功能增强和观众的互动,而“变声”功能就是其中之一。由于直播变声业务的场景特殊性,对变声后语音的自然度与系统运行实时性都要求非常高,而且为了避免网络抖动等带来的干扰,变声系统一般都需要部署在用户客户端(电脑、手机等)上。

不过,直播平台们在这些的技术研发步伐一点也没落下。就在近日,快手成为了业内首次在PC客户端实现基于深度学习实时变声直播的公司。

3434

据悉,快手实现了一套既能保证变声后音色自然稳定,同时又具有高实时性、低复杂度等优势的变声系统。

这项变声技术,可以实现任意用户到目标音色的稳定变声,变声后语音具有自然度高,相似度高,音质清晰等优势,同时整个系统的链路延迟可低至200毫秒。

目前,该技术已经完成算法开发,工程质量测试以及用户灰度测试,并在AcFun直播业务场景(windows 客户端,i7 4核以上机器)全量上线。主播可以通过A站直播伴侣中的变声功能,选择基于深度学习变声的“憨憨音”或者“软妹音”,实现音色切换。

快手还准备将直播变声玩出更多花样,比如多种方言与普通话的双向切换,甚至可以进行用户个性化定制变声音色,更好的实现人工智能为直播平台赋能。

参考资料:https://arxiv.org/abs/1904.05742

https://arxiv.org/abs/2011.00316

https://ieeexplore.ieee.org/document/9362095

相关深度报告 REPORTS

2024-2029年中国网络直播行业商业模式创新与投资机会研究报告
2024-2029年中国网络直播行业商业模式创新与投资机会研究报告

本报告前瞻性、适时性地对网络直播行业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来网络直播行业发展轨迹及实践经验,对网络直播行业未来...

查看详情

本文来源前瞻网,转载请注明来源。本文内容仅代表作者个人观点,本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:service@qianzhan.com) 品牌合作与广告投放请联系:0755-33069875 或 hezuo@qianzhan.com

p36 q0 我要投稿

分享:
标签: 快手 变声 直播

品牌、内容合作请点这里:寻求合作 ››

前瞻经济学人微信二维码

前瞻经济学人

专注于中国各行业市场分析、未来发展趋势等。扫一扫立即关注。

前瞻产业研究院微信二维码

前瞻产业研究院

如何抓准行业的下一个风口?未来5年10年行业趋势如何把握?扫一扫立即关注。

前瞻经济学人 让您成为更懂趋势的人

想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:

  • 10000+ 行业干货 免费领取
  • 500+ 行业研究员 解答你的问题
  • 1000000+ 行业数据 任君使用
  • 365+ 每日全球财经大事 一手掌握
  • 下载APP

  • 关注微信号

前瞻数据库
企查猫
前瞻经济学人App二维码

扫一扫下载APP

与资深行业研究员/经济学家互动交流让您成为更懂趋势的人

下载APP
前瞻经济学人APP

下载前瞻经济学人APP

关注我们
前瞻经济秀人微信号

扫一扫关注我们

我要投稿

×
J