VAE(1)——从KL说起

VAE(1)——从KL说起

 

前面我们介绍了GAN——Generative Adversarial Network,这个网络组是站在对抗博弈的角度去展现生成模型和判别模型各自的威力的,下面我们来看看这种生成模型和判别模型组合的另一个套路——Variational autoencoder,简称VAE。

e293b1e19bdd9093b1f57400b9a773e8423.jpg

许嵩照片,图片来与网络

突然想起来,他也叫VAE,我觉得他还是有点音乐才华的。不过我们今天不去讨论他。

Variational autoencoder的概念相对复杂一些,它涉及到一些比较复杂的公式推导。在开始正式的推导之前,我们先来看看一个基础概念——KL divergence,翻译过来叫做KL散度。

什么是KL散度

无论从概率论的角度,还是从信息论的角度,我们都可以很好地给出KL散度测量的意义。这里不是基础的概念介绍,所以有关KL的概念就不介绍了。

在Variational Inference中,我们希望能够找到一个相对简单好算的概率分布q,使它尽可能地近似我们待分析的后验概率p(z|x),其中z是隐变量,x是显变量。在这里我们的“loss函数”就是KL散度,他可以很好地测量两个概率分布之间的距离。如果两个分布越接近,那么KL散度越小,如果越远,KL散度就会越大。

e7e6a73369c87206dc8c9cdcf71b13bd28d.jpg

KL散度的实战

—1维高斯分布

我们先来一个相对简单的例子。假设我们有两个随机变量x1,x2,各自服从一个高斯分布

那么这两个分布的KL散度该怎么计算呢?

我们知道

ef5aad5912386062ae68c8096b16b88b5b7.jpg

(更新)到这里停一下,有童鞋问这里右边最后一项的化简,这时候积分符号里面的东西是不看着很熟悉?没错,就是我们常见的方差嘛,于是括号内外一约分,就得到了最终的结果——1/2。

805cd99748619c33b3410a1c26eee4082ea.jpg

说实话一直以来我不是很喜欢写这种大段推导公式的文章,一来原创性比较差(都是前人推过的,我就是大自然的搬运工),二来其中的逻辑性太强,容易让人看蒙。不过最终的结论还是得出来了,我们假设N2是一个正态分布,也就是说

那么哪边的力量更强大呢?我们可以作图出来:

import numpy as np

import matplotlib.pyplot as plt

x = np.linspace(0.5,2,100)

y = -np.log(x)+x*x/2-0.5

plt.plot(x,y)

plt.show()

从图中可以看出

46b77314485767c45b454134eba8b81a8b9.jpg

二次项的威力更大,函数一直保持为非负,这和我们前面提到的关于非负的定义是完全一致的。

 

好了,看完了这个简单的例子,下面让我们再看一个复杂的例子。

一个更为复杂的例子:

多维高斯分布的KL散度

上一回我们看过了1维高斯分布间的KL散度计算,下面我们来看看多维高斯分布的KL散度是什么样子?说实话,这一次的公式将在后面介绍VAE时发挥很重要的作用!

首先给出多维高斯分布的公式:

a4c54d89322cfcbf65f3357981cae3b4b44.jpg

由于这次是多维变量,里面的大多数计算都变成了向量、矩阵之间的计算。我们常用的是各维间相互独立的分布,因此协方差矩阵实际上是个对角阵。

考虑到篇幅以及实际情况,下面直接给出结果,让我们忽略哪些恶心的推导过程:

6cbfbb4ce2b67a8c7b0f3fd6fd050964af0.jpg

其实这一次我们并没有介绍关于KL的意义和作用,只是生硬地、莫名其妙地推导一堆公式,不过别着急,下一回,我们展示VAE效果的时候,就会让大家看到KL散度的作用。

坚持看到这里的童鞋是有福的,来展示一下VAE在MNIST数据库上产生的字符生成效果:

13e7e5ef7c8c659dd43b06d2871cbd6c080.jpg

从这个效果上来看,它的功能和GAN是有点像的,那么让我们来进一步揭开它的庐山真面目吧!

转载于:https://my.oschina.net/u/4068302/blog/3025645

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值