生成对抗网络(GAN)简单认识

最新推荐文章于 2020-12-05 23:04:13 发布

-倾城之恋-

最新推荐文章于 2020-12-05 23:04:13 发布

阅读量348

点赞数

分类专栏：神经网络深度学习

本文链接：https://blog.csdn.net/P081513083/article/details/98476460

版权

深度学习同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

神经网络

13 篇文章 0 订阅

订阅专栏

本文简单介绍生成对抗网络的来源及逻辑。
假设我们想训练一个生成器 $G (z)$ ，使得生成器的输出 $x$ 尽可能真实自然，但是是否真实自然这个损失函数很难设计。于是我们想到可以利用一个判别器 $D (x)$ 来判断生成样本 $x$ 的真假。但问题是这个判别器从何而来？既然很难设计，那就不妨训练一个这样的判别器。训练数据分为两类，正例是真实的天然样本，负例是伪造的生成的样本。天然样本当然好获取，那么伪造的生成样本哪里来呢？既然生成器 $G (z)$ 生成的样本不够真实，那么恰好可以被拿来当做负例。这样就有两类样本来训练判别器 $D (x)$ .

假设{X,T}为样本集， $X=\{x_1,..,x_N\}$ ， $T=\{t_1,..,t_N\}$ , $t_i\in\{0,1\}$ 。标签 $0$ 代表样本来自于生成器 $G (x)$ ，标签 $1$ 代表样本来自于天然样本集。

对于二分类问题，类似与逻辑回归， $D (x)$ 只需要一个输出节点 $y$ ，输出的就是样本为真的概率。

则对数似然函数：
$logL({X,T}|\theta_D)=log\prod\limits_{i=1}^NP(t_i|x_i)=log\prod\limits_{i=1}^Ny_i^{t_i}(1-y_i)^{1-t_i}$
注意： $P(t_i|x_i)$ 可以看成关于变量 $t_i, x_i$ 的二元函数，输出为概率。且：
$P(t_i=1|x_i)=y_i=D(x_i)$ ,
$P(t_i=0|x_i)=1-y_i=1-D(x_i)$ 。
所以有：
$logL({X,T}|\theta_D)=log\prod\limits_{i=1}^Ny_i^{t_i}(1-y_i)^{1-t_i} \\=\sum\limits_{i=1}^N\{t_ilogD(x_i)+(1-t_i)log(1-D(x_i))\} \\=\sum\limits_{i=1}^Nt_ilogD(x_i)+\sum\limits_{i=1}^N(1-t_i)log(1-D(x_i))$
因为真样本来自于天然数据集，假样本来自于生成器，所以有：

$\max\limits_{D}E_{x\sim p_{data}}log(D(x))+E_{x\sim p_{model}}log(1-D(x))$
这样就可以最大化 $logL({X,T}|\theta_D)$ ，训练得到 $D (x)$ 。得到 $D (x)$ 后，我们的任务才开始，因为我们的目标是让 $G (z)$ 生成尽可能真的样本。现在我们已经有了训练好的判别器D(x)。我们考虑如何构造损失函数来训练 $G (z)$ 呢？

首先我们的思路就是把 $G (z)$ 的输出直接输入到 $D (x)$ ，并设置监督信号为“真实图片”。这样一来，如果 $D (x)$ 预测x为真实图片，则说明 $G (z)$ 生成的样本很真，符合要求，不返回误差；如果 $D (x)$ 预测x为假，则说明 $G (z)$ 生成的样本很假，需要返回误差更新 $G (z)$ 的权重。也就是说，训练 $D (x)$ 时，真实图片被标记为真，生成图片被标记为假，训练 $G (z)$ 时只有生成图片，并且被标记为真。可以看出，这样的训练 $G (z)$ 目标恰好和训练 $D (x)$ 的目标相反，最大化变为最小化，因此被称为对抗学习。

基于这样的思路，假设生成了 $M$ 个样本，我们设计目标函数：
$\min logL(T,Z|\theta_G)=log\prod\limits_{i=1}^MP(t_i|z_i) \\=log\prod\limits_{i=1}^M(1-y_i)^{1-t_i} \\=log\prod\limits_{i=1}^M(1-y_i) \\=\sum\limits_{i=1}^M log(1-y_i) \\=\sum\limits_{i=1}^M log(1-D(x_i)) \\=\sum\limits_{i=1}^M log(1-D(G(z_i))) \\=E_{z\sim p_{z}}log(1-D(G(z))) \\=E_{x\sim p_{model}}log(1-D(x))$

训练完 $G (z)$ 后，逻辑上可能认为G生成的图片已经得到要求了，因为D已经判断所有生成的图片为真。但是这是假设D是完美判别器的情况下，实际并不是这样。因此我们考虑提升D。或者另外一个思路是，G生成的图片有所提升但是依然很假。用这些生成的图片和天然图片进一步训练D，来提高D的区分能力。然后继续训练G,让D判断…

什么时候停止呢？可以想象的是G的生成会越来越真，直到和天然图片一样。这时候D无法判断，也就是输出0.5的概率值。此时停止。

因此有GAN中的复合优化函数：
$\min\limits_{G}\max\limits_{D}E_{x\sim p_{data}}log(D(x))+E_{x\sim p_{model}}log(1-D(x))$
或者：
$\min\limits_{G}\max\limits_{D}E_{x\sim p_{data}}log(D(x))+E_{z\sim p_{z}}log(1-D(G(z)))$

-倾城之恋-

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
生成对抗网络(GAN)简单认识

本文简单介绍生成对抗网络的来源及逻辑。假设我们想训练一个生成器G(z)G(z)G(z)，使得生成器的输出xxx尽可能真实自然，但是是否真实自然这个损失函数很难设计。于是我们想到可以利用一个判别器D(x)D(x)D(x)来判断生成样本xxx的真假。但问题是这个判别器从何而来？既然很难设计，那就不妨训练一个这样的判别器。训练数据分为两类，正例是真实的天然样本，负例是伪造的生成的样本。天然样本当然好获...
复制链接

扫一扫

专栏目录