语音信号处理的总体结构
从这个总体结构可以看出:无论是语音识别,还是语音编码与合成,输入的语音信号首先要进行预处理。
预处理
对信号进行适当放大和增益控制,并进行反混叠滤波来消除工频信号的干扰。
数字化
将模拟信号转化为数字信号便于用计算机来处理。
提取特征
用反映语音信号特点的若干参数来代表语音。
voice conversion
我的理解:是音色转换问题的一个分支。
最近的论文:
一.CycleGAN-VC:Parallel-Data-Free Voice Conversion Using Cycle-Consistent Adversarial Networks
CycleGAN-VC:使用周期一致的对抗网络进行并行无数据语音转换
介绍CycleGAN-VC的官方网站:http://www.kecl.ntt.co.jp/people/kaneko.takuhiro/projects/cyclegan-vc/
面存在困难的逐帧方法[27,30]相比,CycleGAN-VC [29]([32]中发表)使得学习序列成为可能 - 通过使用具有门控CNN [36]和身份映射损失[37