阅读"voice conversion using deep bidirectional long short-term memory based recurrent neural networks"

  1. VC的两种方法:
    • 基于规则:修改语音信号
      • ”Frequency warping based on mapping formant parameters”
      • “Weighted frequency warping for voice conversion”
    • 基于统计:估计从源信号到目的信号的map函数
      • GMM:原理参考基于高斯混合模型的语音转换技术研究
        • ”Continuous probablistic transform for voice conversion”
        • “Voice conversion based on maximum-likelihood estimation of spectral parameter trajectory” 使用动态特征和全局方差
      • DBN:
        • ”A fast learning algorithm for Deep Belief Nets”
        • “Acoustic modeling using Deep Belief Networks”
        • “Voice conversion in high-order eigen space using Deep Belief Nets”
      • RMB:
        • ”Joint spectral distribution modeling using Restricted Boltzmann Machines for voice conversion”
        • “Voice conversion using Deep Neural Networks with layer-wise
          generative training”
      • RNN:
        • High-order sequence modeling using speaker-dependent recurrent temporal Restricted Boltsmann Machines for voice conversion
        • 缺点:只能利用previous context而不是future context, 切由于vanishing and exploding gradients(参考”Learning long-
          term dependencies with gradient descent is difficult”),也不能处理长序列
      • BLSTM-RNN:Bidirectional Long Short-Term Memory
        • ”Framewise phoneme classification with bidirectional LSTM and other neural network architectures”
        • “Long Short-Term Memory”
  2. 传统RNN模型
  3. Bidirectional RNN模型:利用sequence
  4. LSTM模型
  5. BRNN与LSTM结合
  6. 6.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值