从暑假看到现在终于在<这篇文章>的帮助下搞懂了,期间看了无数的中文关于vae的博客文章,一个个基本上不是少讲了这个就是少讲了那个,最后总是搞不懂,还走了不少弯路,去研究变分推断本身,其实只是为了看懂vae的原理,是不必深度了解变分推断的。
话不多说,说正题,这里我只会讲下大概,具体的请看原始文章。
自编码模型
自编码模型是把原始特征压缩为中间维度,再讲中间维度解码为原始特征,最后衡量在这编码和解码的过程中损失了多少的信息,将这个损失的信息降到最低。
但是在这个过程中,模型可能会为了降低这个loss,就将训练集的内容死记硬背住了,所以在隐特征空间只有那么几个点有意义,大片的空间都变得没有意义。
变分自编码模型
直观理解
自编码模型有2个严重的问题:
- 没有连续性,训练集在隐藏空间投射的点有意义,但是其中大片的空间都是没有任何信息的
- 隐藏空间没有规则。
VAE就是解决这两个问题,与AE将x投射到隐藏空间为点不同,VAE将之投射为一个正态分布,这样整个空间都会弥散着这个x的信息,只不过信息浓度在正态分布的均值