![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
RNN
DreaMaker丶
这个作者很懒,什么都没留下…
展开
-
NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS
摘要: 循环的seq2seq特征预测网络将嵌入式字符向量映射到梅尔刻度声谱图 声码器:改良版WaveNet负责合成时域波形 使用这个紧凑的声学中间特征可以显著简化WaveNet的结构 介绍: Concatenative synthesis with unit selection(单元挑选和拼接式合成技术) 把预先录制的语音波形的小片段缝合在一起 Statistical para...原创 2019-04-16 11:50:39 · 1065 阅读 · 0 评论 -
TACONTRON: A Fully End-to-End Text-To-Speech Synthesis Model
Generate speech at the frame level 统计参数TTS: 文本前端:提取语言特征 声学特征预测模型 基于信号处理的声音合成器 优点: 减轻了复杂的工作 可以应对复杂的条件和多种情况(语者,语种,情感) 相较多阶段模型,鲁棒性更高 TTS:解压(文字->声音),输出是连续的,输出序列会比输入序列要长的多 Ta...原创 2019-04-15 13:08:54 · 953 阅读 · 0 评论