个性化语音——总结

  1. 时间 2016.5.4~2016.7.20
  2. 成果:
  3. AHOcoder(Linux 64bit):AHOcoderAHOdecoder
  4. 方案:
    • 基于Voice Conversion 的语音序列转换
      • 总体思路
        微软VC
    • 基于TTS的adaption(使用DNN或HTS demo中方法)
      这里写图片描述
  5. 可行性分析

  6. 关键点
    • 声音编码解码器:AHOcoder,STRAIGHT,HTK,Sphinx,Kaldi
    • 时间序列对齐算法:SPTK中dtw,或一些matlab代码
    • 参数生成算法:考虑global variance的parameter generation algorithm,参考hts_engine源码
    • 模型:GMM,FFNN,SJAE,RNN(BLSTM)
    • TTS:HMM+神经网络
    • adaption算法:参考hts_engine源码,或一些基于DNN的adaption算法
    • 。。。等
  7. GMM方法介绍

    • 对cmu语料库,使用wav2raw将16khz的raw文件转换为wav文件,再使用sox命令将wav文件转换为AHOcoder所要求的格式的文件
    • 用./ahocoder .wav .lf0 .mgc生成lf0和mgc文件,可分别选5句话作为train,其余作为test
    • 使用adaption.sh对lf0进行adaption转换,首先要选好train和test的list,之后进行adaption
    • 对mgc进行dtw
    • 生成gmm模型function [G,P]=gmmtrain(X,m)
    • 进行blfwas转换训练function [alfa,R]=blfwastrain(X,Y,P)
    • 进行测试:
      • 对向量分类function [P,L]=gmmprobs(G,X)
      • 进行blf转换,并把c0加进去,function Y=blfwasconv(X,alfa,R,P))
  • 7
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值