voice conversion
文章平均质量分 82
林林宋
不要急,不要慌,知识总是一点点积累起来的
展开
-
ONE-SHOT VOICE CONVERSION USING STAR-GAN
单位:网易游戏 伏羲组会议:2020 ICASSP作者:Wang Ruobai, Ding Yuabstract做one-shot VC,用starGAN做语音转换,额外的speaker id做说话人标记,模型依赖一个中文,一个英文数据集(一共38人),可以成功实现一句话的VC,并且模型可以随着数据量的增加而更新。1. introduction...翻译 2020-05-01 16:19:43 · 892 阅读 · 5 评论 -
Multi-Speaker and Multi-Domain Emotional Voice Conversion Using Factorized Hierarchical Variational
会议:2020 ICASSP单位:韩国KAISTabstractemotional voice conversion,在两种以上的情绪之间的转换会造成信号失真。FHVAE(变分自编码器)已经被证明可以生成sequence-level (如说话人表示)以及segment-level的特征。本文利用FHVAE生成情感表示,用于emotional voice conversion。...翻译 2020-04-30 22:00:14 · 617 阅读 · 0 评论 -
ONE-SHOT VOICE CONVERSION BY VECTOR QUANTIZATION
单位:台湾国立大学会议:2020 icasspabstractvector quantization (VQ) 的方法实现one-shot vc,不需要任何说话人标记。把文本信息建模成一系列离散的编码,将向量量化前后的区别认为是speaker embedding。仅通过重建损失函数解耦说话人信息和文本信息。1. introductionVC可以分成监督学习和无监督学习监督学习:基于平...翻译 2020-04-30 21:37:40 · 1128 阅读 · 1 评论 -
网络层面解析vc-frame2frame
pre-net 激活函数relunormalize层的激活函数是relu, 输出范围(0,+∞)conv1d的activation=Nonehighway 层 output = H * T + inputs *CH–relu T–sigmoid C=(1-T)tf.nn.bidirectional_dynamic_rnn()默认情况下是没有激活函数的tf.layer.dense 也...原创 2019-09-03 17:40:08 · 255 阅读 · 0 评论