如何解决TTS个性化场景数据?

个性化TTS应用
智能交互、自动客服、虚拟主持人

个性化TTS数据如何解决?

专业TTS数据制作
为产品塑造独特声音形象:根据产品特点筛选符合音色的声优,高标准录制数十小时音库
数据采集:中文、英文、中英混杂
数据标注:发音校对、音素转写、音素边界切分、韵律标注、词性标注、重音标注、发音词典制作

案例:美式英语TTS数据制作
发音人:美国女声
数据量:2万句,20小时
录音环境:专业录音室,专业麦克风
标注内容:发音校对、音素转写、音素边界切分、韵律标注、重音标注、词性标注、发音词典制作

普通人TTS数据制作
用于迁移学习的个性化声音合成:根据应用场景,筛选数千普通人在录音棚或按照要求环境下录制
数据采集:中文、英文、中英混杂
数据标注:发音校对、音素转写、发音词典制作

案例:素人TTS采集
发音人:普通话
数据量:1000人,每人300句
录音环境:专业录音室,专业麦克风
标注内容:发音校对

前端模型数据制作
用于TTS前端模型的预处理:根据提供文本,进行韵律标注及多音字、数字、符号的读音标注
数据标注:多音字读音标注、数字读法标注、符号读音标注、韵律标注

案例:前端模型数据标注

200万句多音字读音标注:选择正确的拼音

100万句数字读法标注:电报读法还是序数读法

100万句符号读音标注:选择正确的读法

TTS数据:
200小时TTS普通话成人大库
1000普通人个性化语音库
20万条中文文本韵律语料库
汉语多音字语料库(10万句,100多音字)
数字读法语料库(10万句)

https://www.datatang.com/dataset/all/1

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值