论文笔记
文章平均质量分 91
大雪001
这个作者很懒,什么都没留下…
展开
-
《SELF-ATTENTION GENERATIVE ADVERSARIAL NETWORK FOR SPEECH ENHANCEMENT》论文笔记
论文地址:https://ieeexplore.ieee.org/abstract/document/9414265会议:ICASSP2021Abstract目前语音增强的对抗生成网络仅依赖于卷积运算,这可能会掩盖输入序列中的时间依赖性。为解决该问题,提出一种适应非局部注意力的注意力层,并结合时域语音增强GAN的卷积和反卷积。实验结果显示,将自注意力引入SEGAN会让客观评估指标持续改进。Existing generative adversarial networks (GANs) for spe原创 2021-06-23 13:48:36 · 529 阅读 · 2 评论 -
《MASKCYCLEGAN-VC: LEARNING NON-PARALLEL VOICE CONVERSION WITH FILLING IN FRAMES》论文笔记
AbstractCycleGAN-VC3中使用的TFAN模块会大大增加计算量。作为替代,本文提出MaskCycleGAN-VC,它是CycleGAN-VC2的一种扩展,使用一种FIF(filling in frames)进行训练。使用FIF,可以将时域Mask应用于输入的Mel频谱图并且可以激励转换器根据周围的帧来填充丢失的帧。FIF能够以自监督的方式学习时频结构,无需其他模块。As an alternative, we propose MaskCycleGAN-VC, which is anothe原创 2021-05-19 15:41:57 · 697 阅读 · 0 评论 -
《A VOCODER-FREE WAVENET VOICE CONVERSION WITH NON-PARALLEL DATA》论文笔记
目录1 Abstract2 Introduction3 Voice Conversion With WaveNet3.1 WaveNet Vocoder3.2 The Limitations1 Abstract本文提出一种自由使用声码器的语音转换方案,该方案使用WaveNet和非平行语料进行训练,使用WaveNet将 Phonetic Posterior Grams(PPG)直接映射到波形样本,以此来代替中间特征的处理。这样,我们避免了由声码器和特征转换引起的估计误差。 此外,由于PPG被假定为与说话者原创 2021-05-07 10:31:43 · 249 阅读 · 1 评论