flowwavenet
文章平均质量分 98
林林宋
不要急,不要慌,知识总是一点点积累起来的
展开
-
flow的相关数学推倒
先说一下仿射变换的概念:仿射变换就是允许图形任意倾斜,保证原来的线共点、点共线,平行关系不变,原来的中点还是中点。但不能保证原来的长度不变,也不能保证原来的角度不变。仿射变换用矩阵可以表示为参考:仿射变换、平移变换、缩放变换、剪切变换https://www.cnblogs.com/bnuvincent/p/6691189.html...原创 2019-04-30 17:30:22 · 278 阅读 · 0 评论 -
p0003-- WAVGLOW-A FLOW-BASED GENERATIVE NETWORK FOR SPEECH SYNTHESIS
abstract: 将Glow和WavNet结合生成WAVGLOW,不需要auto-regression,只需要一个网络,一个损失函数--最大化 训练集的似然,就可以将mel-spectrogram生成wav。可以生成500KHZ以上的采样率且性能超过wavnet,比实时快25倍。introduction: 在人机交互任务中,好质量,实时的语音合成非常重要。语音合成需...原创 2018-12-28 15:58:45 · 878 阅读 · 0 评论 -
flow的理论背景
生成模型生成模型的本质是希望能够拟合一个概率分布,深度神经网络可以拟合任何的函数,但是不能拟合任何的概率分布,因为概率分布有非负性和归一性的本质。这样,直接能写的分布只有离散分布和连续的高斯分布。从严格意义讲,图像是由有限个像素组成的,每个像素的取值也是离散的,有限的,因此可以通过离散分布来描述图像的分布,pixel RNN就是基于这个思路做的,“自回归流”的思路。缺点是无法并行,计算量很大...原创 2019-05-08 22:32:07 · 1494 阅读 · 0 评论 -
Flowavenet:A Generative Flow for Raw Audio
1.abstract&&introduction: 现有的TTS大部分用wavenet作为解码器合成语音,但是显著的缺点在于slow auto-regressive sampling scheme,因此难以在实时应用中用起来。Kingma等对此改进提出IAF(inverse auto-regressive flow),可以实现并行化采样,实现了实时合成,这种方法不仅需要一个...原创 2019-05-12 21:54:40 · 644 阅读 · 0 评论