GAN 的理解

最新推荐文章于 2023-05-15 14:09:22 发布

larkii

最新推荐文章于 2023-05-15 14:09:22 发布

阅读量292

点赞数

分类专栏：模型解读

本文链接：https://blog.csdn.net/weixin_44795555/article/details/104640538

版权

模型解读专栏收录该内容

9 篇文章 0 订阅

订阅专栏

简介

在这里插入图片描述
上图中 $P_G$ 和 $P_{data}$ 我们都是不知道的，因此无法表示他们，故无法计算KL散度（Div表示KL Divergence）。GAN神奇的地方就是不直接计算两个概率分布的KL散度，而是通过判别器来解决这个问题，如上图中所示，引出目标函数 $V (G, D)$ ，通过最优化这个目标函数来达到最小化KL散度的目标。

理论：

$\mathop{min}\limits_{G}\mathop{max}\limits_{D}V(D,G)=E_{x\sim p_{data}(x)}[logD(x)]+E_{z\sim p_(z)}[log(1-D(G(z)))]$

其中 $V$ 表示Value， $x$ 表示真实数据， $z$ 表示噪声， $G (z)$ 表示生成器生成的样本， $E$ 表示期望。

$D$ 想增加这个值Value（通过对 $D (x)$ 输出1， $D (G (z))$ 输出0，即正确分类，使V接近0）， $G$ 想减小这个值（通过让 $D$ 把 $G (z)$ 分为1，使V负无穷）。当二者达到纳什平衡时，它们各自达到最优。

注： $D(x)\in (0,1)$ ， $V(D,G)\in (-∞,0]$ 。

实际：

根据前面价值函数 V(G,D) 的定义，我们需要求两个数学期望，即 E[log(D(x))] 和 E[log(1-D(G(z)))]，其中 x 服从真实数据分布，z 服从初始化分布。但在实践中，我们是没有办法利用积分求这两个数学期望的，所以一般我们能从无穷的真实数据和无穷的生成器中做采样以逼近真实的数学期望，即：
$\mathop{min}\limits_{G}\mathop{max}\limits_{D}\tilde{V}{(D,G)}=\frac{1}{m} \sum_{i=1}^{m} \log D\left(x^{i}\right)+\frac{1}{m} \sum_{i=1}^{m} \log \left(1-D\left(G(z^i)\right)\right)$

训练时，分别固定 $G$ ，最大化 $L (D)$ 和固定 $D$ ，最小化 $L (G)$ 。

伪代码： 在这里插入图片描述
第一步我们训练D，D是希望V(G, D)越大越好，所以是加上梯度(ascending)。第二步训练G时，V(G, D)越小越好，所以是减去梯度(descending)。整个训练过程交替进行。

内循环 $D$ 的迭代次数 $k$ 也可以多于 $G$ 。因为有一个好的判别器才能引导生成器的学习。

参考：机器之心

larkii

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
GAN 的理解

理论：maxGminDV(D,G)=Ex∼pdata(x)[logD(x)]+Ez∼p(z)[log(1−D(G(z)))]\mathop{max}\limits_{G}\mathop{min}\limits_{D}V(D,G)=E_{x\sim p_{data}(x)}[logD(x)]+E_{z\sim p_(z)}[log(1-D(G(z)))]GmaxDminV(D,G)=Ex∼pd...
复制链接

扫一扫

专栏目录