深度学习-李宏毅GAN学习之fGAN

最新推荐文章于 2023-04-10 16:44:40 发布

王伟王胖胖

最新推荐文章于 2023-04-10 16:44:40 发布

阅读量2.3k

点赞数 5

分类专栏：李宏毅机器学习生成对抗网络GAN 深度学习文章标签： GAN 生成对抗网络深度学习 fGan 散度函数

本文链接：https://blog.csdn.net/wangwei19871103/article/details/93880910

版权

深度学习同时被 3 个专栏收录

75 篇文章 13 订阅

订阅专栏

李宏毅机器学习

36 篇文章 20 订阅

订阅专栏

生成对抗网络GAN

10 篇文章 2 订阅

订阅专栏

深度学习-李宏毅GAN学习之fGAN散度函数

散度函数
共轭函数(Fenchel Conjugate)
一些问题
- Mode Collapse
- Mode Dropping
总结

散度函数

上一篇讲了GAN的数学原理，这次继续深入。

这次讲fGan，也就是将GAN的散度函数的统称，上篇将了2个散度，KL散度和JS散度，当然GAN还有其他的散度函数。

在这里插入图片描述
上图所示，我们可以将散度函数统一定义为上面这个公式，f()就是不同的散度函数，Df就是在f散度函数下，P,Q分布的差异。规定f是凸函数(为了用琴生不等式)， $f (1) = 0$ (如果两个分布一样，刚好公式=0)。
在这里插入图片描述
因为f是凸函数，所以可以用琴生不等式，具体可以点进去看看介绍，其实就是我们所学的凸函数的一种泛化推广不等式，可以推广到概率上，就是函数的期望>=期望的函数， $E (f (x)) \geq f (E (x))$ ，具体有兴趣可以找资料看看怎么推导的。因此就有如下推导
在这里插入图片描述
可以看出，散度是个非负数，最小就是0。

我们看看上次我们讲的一些散度函数：
在这里插入图片描述

就是我们的KL散度。

在这里插入图片描述

Reverse KL散度

在这里插入图片描述

好像叫卡方散度

共轭函数(Fenchel Conjugate)

每一个散度函数都有对应的共轭函数，定义为：
在这里插入图片描述
对于每个t都可以找到一个x，使得 $x t - f (x)$ 最大，比如找t1,t2,两个点，x取x1,x2,x3,可以看到：

$y (t) = x t - f (x)$ 可以看做是t的函数，是条线，t是任意的，因此可以画出很多条线，每个t总会找到一个对应的最大y值和对应的x，可以猜到这样的点连起来应该是个凸函数：
在这里插入图片描述

我们拿 $f (x) = x l o g x$ 来说，当x=10,1, 0.1时可以看到相应的函数直线，可以看到最大化y的点连起来是个凸函数，很类似 $e^{t-1}$ .
在这里插入图片描述
$e^{t-1}$ 公式图像：

用数学来推一下：
将 $f (x) = x l o g x$ 代入 $y (t) = x t - f (x)$ ，得 $y (x) = x t - x l o g x$ ,对于每个给定的t都可以求出最大值，求导=0即可。
求导后得： $t - l o g x - 1 = 0$ ,即x= $e^{t-1}$ ,代入 $f^*(t)$ ,得 $f^*(t)=te^{t-1}-e^{t-1}(t-1)=e^{t-1}$ ,
同样可求得 $f^*(t))^*=f(x)$ ,从而问发现这样的关系，貌似有点像矩阵求2次逆又回来了。
在这里插入图片描述
那这个跟GAN有啥关系呢

可以看到，我们的散度里的f(x)可以用上面求max的来表示，我们可以训练个D(x)，输入x输出t，从而替换进公式，最后可得
在这里插入图片描述
然后可以化为期望：

我们的目标G：

可以看到，散度最后跟 $f^*$ 是相关的，我们想用上面散度，只要换这个就行。
附上一张散度函数相关的图：

写了那么多，主要就是一个思想，不同的散度函数都可与GAN，会产生不同的效果。