论文链接
零碎知识
- 可以通过在训练前,先用无监督的方式将输入映射到更为有意义的向量空间的方式,来减轻训练深度生成、判别模型的困难。
- 可以通过逐层初始化的方式来获得更好的效果。
网络
原理
- 好的模型学习到的应该是数据潜在的分布。
- 而对于输入的高维向量而言,可能有些维度并没有携带信息,甚至可能携带噪音。
- 一个维度与其它多个维度应该是相关的,即该维度的信息是由与它相关的维度和它自己共同决定的。
- 所有,如果对某些维度加入噪音,模型应当还是可以学到数据本身的分布。
结构
图中 x x x是原始输入, x ^ \hat{x} x^是加入噪音后的输入, y