综述PPG的来历,定义以及16年的PPG跨语言论文
组会PPT 链接: https://pan.baidu.com/s/1tNtb4zFcY60iaclxK2rfEA 提取码: sk3w
思路:坏PPG索引Mel坏不要去训练LSTM,要找到配套的好PPG
新的思路,结合双语PPG,利用双语ASR辨识精确特征空间
问题:让PPG跨语言效果接近同语言效果,仍使用16,20年框架
PPG在同语言自己一对多,跨语言不同人一对多现象
提出已有论文问题
借鉴已有的结构,再加一个观察中文Mel和英文Mel是否重合的统计
除了双语PPG外,增加别的信息解决多Mel对1PPG问题的尝试
PPG提取代码
PPG->linear代码版本一
自己借鉴卢辉代码写的tf版本,但是不会弄超参,训不出来效果
/datapool/home/hujk17/linears_decoder
https://github.com/ruclion/linears_decoder
PPG->linear代码版本二
直接将tacotron输入改为ppg,输出为linear,可以训出效果,但是5ms序列太长,训练太慢,也不稳定
服务器路径中.git信息放在下面:
/datapool/home/hujk17/linears_decoder_tacotron-2-joee_bs4_r2
但是具体超参数在枚举,效果好的是bs8_r5
https://github.com/ruclion/linears_decoder_tacotron-2-joee
PPG->linear代码版本三(正在使用10ms版)