在主流直播平台上,主播往往需要一些趣味性强的功能增强和观众的互动,而“变声”功能就是其中之一。由于直播变声业务的场景特殊性,对变声后语音的自然度与系统运行实时性都要求非常高,而且为了避免网络抖动等带来的干扰,变声系统一般都需要部署在用户客户端(电脑、手机等)上。
不过,直播平台们在这些的技术研发步伐一点也没落下。就在近日,快手成为了业内首次在PC客户端实现基于深度学习实时变声直播的公司。
据悉,快手实现了一套既能保证变声后音色自然稳定,同时又具有高实时性、低复杂度等优势的变声系统。
这项变声技术,可以实现任意用户到目标音色的稳定变声,变声后语音具有自然度高,相似度高,音质清晰等优势,同时整个系统的链路延迟可低至200毫秒。
目前,该技术已经完成算法开发,工程质量测试以及用户灰度测试,并在AcFun直播业务场景(windows 客户端,i7 4核以上机器)全量上线。主播可以通过A站直播伴侣中的变声功能,选择基于深度学习变声的“憨憨音”或者“软妹音”,实现音色切换。
快手还准备将直播变声玩出更多花样,比如多种方言与普通话的双向切换,甚至可以进行用户个性化定制变声音色,更好的实现人工智能为直播平台赋能。
参考资料:https://arxiv.org/abs/1904.05742
https://arxiv.org/abs/2011.00316
https://ieeexplore.ieee.org/document/9362095
本报告前瞻性、适时性地对网络直播行业的发展背景、供需情况、市场规模、竞争格局等行业现状进行分析,并结合多年来网络直播行业发展轨迹及实践经验,对网络直播行业未来...
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734