古代的文本多是用汉字记载,而两广地区的长辈们,在给晚辈讲故事的时候,都会先看汉字书籍,再转换成粤语的白话文讲给晚辈听。这种习惯一直流传至今,渐渐形成了一种风俗,也就是我们现在所说的“讲古”。粤语讲古不仅仅是长辈给晚辈丰富知识库、建立世界观的方式,更是一种情感上的交流。
而对于两广以外的人来说,粤语的影响也尤为深远,从青少年时期接触的粤语电影、歌曲,到现在依然着迷的粤语文化、影视剧,这些都深深地影响着他们的情感、生活。
为了延续粤语中类似讲古这样的文化与情感传承,为了让更多的人能够感受到粤语文化的魅力,也为了更好地服务两广地区乃至世界各地的粤语相关使用人群,深声科技精心打造了粤语语音合成技术。
粤语语音合成的技术难点
粤语语音合成的开发难度并不低,甚至可以说比普通话的语音合成难度更高。
首先,粤语相比普通话有更多的音调,且不同地区的人由于方言原因讲话习惯差异较大,难以界定一个标准,增加了数据标注和技术开发的难度。例如,广州粤语就会有很多变调,且目前变调没有绝对的规律。
同时,粤语懒音,比如 n、l不分,ng和m不分等,这是数据标注以及技术上的文字拼音预测环节需要有所取舍的,到底是正音还是跟随大众读法。
还有,就是用字了。文本转语音前,会遇到繁简转换的问题,比如繁体的“著”转简体会有两种不同的字音与之对应,有 “著”和“着” 。
而在面对以上种种困难的情况下,深声科技依然做出了高质量的粤语语音合成效果。
深声科技粤语合成技术亮点
在深声科技最终的粤语合成音频里,粤语的音色还原度高,合成效果与真人无异。同时,合成粤语发音准确、真实自然。
并且,同深声科技普通话的语音合成一样,粤语语音的音质清晰稳定,声音明亮无杂音。
粤语语音合成之后,适用范围广泛,例如用粤语做客服对于习惯说粤语的用户会有亲切感,公共场所的语音播报也可以通过粤语语音合成减少人工成本,还有各式各样的语音类APP——粤语电台、粤语教学等等都可以使用。
在支持粤语语音合成之后,深声科技并不止步。因为严格来说,粤语是方言的一种,它有自己独特的文化内涵和情感内涵,其他方言也是一样。所以,深声科技在完成粤语语音合成之后,还会支持更多的地方方言语音合成。
更多语音技术服务
除了语音合成之外,深声科技还有声音定制的服务,这是专门为企业客户提供包括明星声音、IP声音、个性化声音等的定制服务。
深声科技已经实现了3天内交付客户的声音定制服务,这3天内的时间包括了所需30分钟内的语音数据的制作过程。从语音数据量的减少到交付时间大大缩短,都能为企业提高运作效率和经济效益。
除满足企业客户的声音定制需求外,深声科技也在2020年1月推出了为终端用户提供的门槛更低、使用价值更高的声音克隆技术。
声音克隆技术是用户在获得企业授权的情况下,用户仅需一部智能手机,在安静的环境下,配合完成90秒的语音录音,就可以克隆出理想的声音。
声音克隆可以克隆亲人如父母、子女、伴侣的声音,也可以通过分享使用明星、网红、动漫人物的声音,让具备语音交互功能的智能设备的声音变得更有趣,也更温暖。
关注声音与AI结合的未来,关注深声科技,一家致力于让声音服务好每个人的生活的声音科技公司。
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734