个性化语音——总结

最新推荐文章于 2022-06-07 06:09:10 发布

sunflower_Yolanda

最新推荐文章于 2022-06-07 06:09:10 发布

阅读量9k

点赞数 7

分类专栏：语音文章标签：个性化语音

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunflower_Yolanda/article/details/51979551

版权

时间 2016.5.4~2016.7.20
成果：
- 基于Voice Conversion的demo：VC demo百度网盘分享
- 基于TTS adaption的demo：TTS adaption demo百度网盘分享
- TTS demo：基于HMM的TTS demo百度网盘分享
AHOcoder(Linux 64bit)：AHOcoder、AHOdecoder
方案：
- 基于Voice Conversion 的语音序列转换
  - 总体思路
- 基于TTS的adaption(使用DNN或HTS demo中方法)
可行性分析
- Voice Conversion 方法可以尝试，但效果达不到在工业界上应用的标准，学术界有利用GMM、DNN、RNN进行特征转换的尝试，最少能利用5句话进行训练，demo效果一般。链接如下：
  - 微软：DNN VC
  - 香港科技大学：BLSTM VC
  - 印度OHSU：Joint AE VC
  - 日本东京大学：GMM VC
  - 法国tut：基于DKPL回归
  - Voice Morphing：Voice Morphing
- TTS方法较VC方法效果更好，百度和微软使用，如百度的个性化TTS，没有找到相关产品链接。学术界的demo链接如下：
  - 日本Kobayashi 实验室：Speaker-Independent HMM-Based Voice Conversion
  - 爱丁堡大学：Listening test materials for “A study of speaker adaptation for DNN-based speech synthesis”
  - TOKUDA and NANKAKU LABORATORY
关键点
- 声音编码解码器：AHOcoder，STRAIGHT，HTK，Sphinx，Kaldi
- 时间序列对齐算法：SPTK中dtw，或一些matlab代码
- 参数生成算法：考虑global variance的parameter generation algorithm，参考hts_engine源码
- 模型：GMM，FFNN，SJAE，RNN(BLSTM)
- TTS：HMM+神经网络
- adaption算法：参考hts_engine源码，或一些基于DNN的adaption算法
- 。。。等
GMM方法介绍
- 对cmu语料库，使用wav2raw将16khz的raw文件转换为wav文件，再使用sox命令将wav文件转换为AHOcoder所要求的格式的文件
- 用./ahocoder .wav .lf0 .mgc生成lf0和mgc文件，可分别选5句话作为train，其余作为test
- 使用adaption.sh对lf0进行adaption转换，首先要选好train和test的list，之后进行adaption
- 对mgc进行dtw
- 生成gmm模型function [G,P]=gmmtrain(X,m)
- 进行blfwas转换训练function [alfa,R]=blfwastrain(X,Y,P)
- 进行测试：
  - 对向量分类function [P,L]=gmmprobs(G,X)
  - 进行blf转换，并把c0加进去，function Y=blfwasconv(X,alfa,R,P))

最低0.47元/天解锁文章

sunflower_Yolanda

关注

7
点赞
踩
27

收藏

觉得还不错? 一键收藏
6
评论
个性化语音——总结

时间 2016.5.4~2016.7.20成果：基于Voice Conversion的demo：VC demo百度网盘分享基于TTS adaption的demo：TTS adaption demo百度网盘分享TTS demo：基于HMM的TTS demo百度网盘分享github：Voice Conversion Project AHOcoder(Linux 64bit)：AHOcod
复制链接

扫一扫

专栏目录

sunflower_Yolanda CSDN认证博客专家 CSDN认证企业博客

码龄9年

104: 原创

74万+: 周排名

75万+: 总排名

13万+: 访问

: 等级

2162: 积分

41: 粉丝

26: 获赞

12: 评论

27: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于注意力机制的机器翻译——经典论文解读与代码实现
CSDN-Ada助手: 非常感谢您的分享，这篇博客深入浅出地讲解了基于注意力机制的机器翻译，让读者受益匪浅。我觉得您可以继续写一篇关于深度学习中的自然语言处理技术的博客，介绍一些最新的研究进展和实践应用，这样的技术文章对其他用户也会非常有帮助。期待您的下一篇博客，相信会有更多读者受益于您的分享。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
个性化语音——总结
做只幽默的程序袁: 可否加下QQ1837582421本人是西安交大语音合成专业的硕士生，想一起探讨个性化语音合成。
个性化语音——总结
ShaunSXLiu: 5. 可行性分析--> 1. VC 第二条的方法来自香港中文大学孙立发，希望您信息准确点，尊重一下作者，谢谢。
Ubuntu安装Bazel
xiaqing01: 源代码安装有错，请问你自己试了没？
带环链表
zybwww: 如果c比环的长度大的话怎么办？

大家在看

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。