Gan损失函数问题

最新推荐文章于 2024-04-20 13:08:20 发布

Nightmare004

最新推荐文章于 2024-04-20 13:08:20 发布

阅读量1.7k

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_39942341/article/details/119905791

版权

深度学习专栏收录该内容

49 篇文章 2 订阅

订阅专栏

生成器 $G (x)$
鉴别器 $D (x)$
$r$ 是真实的数据
$z$ 是噪声
$g$ 是生成器的分布
鉴别器损失函数
设为公式（1）
$\begin{aligned} &\quad loss_{D} \left(x \right )\\ &=- E_{x \sim p_{r}\left(x \right )} \left(\log \left(D\left(x \right ) \right ) \right ) - E_{z \sim p_{z}\left(z \right )} \left(\log \left(1- D \left(G\left(z \right ) \right ) \right ) \right ) \\ &= - E_{x \sim p_{r}\left(x \right )} \left(\log \left(D\left(x \right ) \right ) \right ) - E_{x \sim p_{g}\left(x \right )} \left(\log \left(1- D \left(x \right ) \right ) \right ) \end{aligned}$
生成器损失函数
第一种
设为公式（2）
$\begin{aligned} &\quad loss_{G} \left(x \right )\\ &=E_{z \sim p_{z}\left(z \right )} \left(\log \left(1-D \left(G\left(z \right ) \right ) \right ) \right ) \\ &=E_{x \sim p_{g}\left(x \right )} \left(\log \left(1- D \left(x \right ) \right ) \right ) \end{aligned}$
第二种
设为公式（3）
$\begin{aligned} &\quad loss_{G} \left(x \right )\\ &=E_{z \sim p_{z}\left(z \right )} \left(-\log \left(D \left(G\left(z \right ) \right ) \right ) \right ) \\ &=E_{x \sim p_{g}\left(x \right )} \left(-\log \left(D \left(x \right ) \right ) \right ) \end{aligned}$
最优鉴别器
对 $loss_{D} \left(x \right )$ 求导，令其 $= 0$
$D^{*} \left(x \right ) =\frac{p_{r}\left(x \right )}{p_{r}\left(x \right )+p_{g}\left(x \right )}$
对于公式2，加上一个与 $g$ 无关的项
$E_{x \sim p_{r}\left(x \right )} \left(\log \left(D\left(x \right ) \right ) \right ) + E_{x \sim p_{g}\left(x \right )} \left(\log \left(1- D \left(x \right ) \right ) \right )$
代入最优鉴别器
$\begin{aligned} &\quad E_{x \sim p_{r}\left(x \right )} \left(\log \left(D^{*}\left(x \right ) \right ) \right ) + E_{x \sim p_{g}\left(x \right )} \left(\log \left(1- D^{*} \left(x \right ) \right ) \right )\\ &=E_{p_{r}}\log \frac{p_{r}\left(x \right )}{p_{r}\left(x \right )+p_{g}\left(x \right )} + E_{p_{g}}\log \left(1- \frac{p_{r}\left(x \right )}{p_{r}\left(x \right )+p_{g}\left(x \right )} \right )\\ &= E_{p_{r}}\log \frac{p_{r}\left(x \right )}{p_{r}\left(x \right )+p_{g}\left(x \right )} + E_{p_{g}}\log \left( \frac{p_{g}\left(x \right )}{p_{r}\left(x \right )+p_{g}\left(x \right )} \right ) \end{aligned}$
等价于
$\begin{aligned} &\quad E_{p_{r}}\log \frac{p_{r}\left(x \right )}{\frac{p_{r}\left(x \right )+p_{g}\left(x \right )}{2}} + E_{p_{g}}\log \frac{p_{g}\left(x \right )}{\frac{p_{r}\left(x \right )+p_{g}\left(x \right )}{2}}-2\log2\\ &=D_{KL} \left(p_{r} || \frac{p_{r}\left(x \right )+p_{g}\left(x \right )}{2}\right )+ D_{KL} \left(p_{g} || \frac{p_{r}\left(x \right )+p_{g}\left(x \right )}{2}\right ) -2\log2\\ &=2JSD \left(p_{r}|| p_{g} \right ) -2 \log \left(2 \right ) \end{aligned}$
所以越训练鉴别器他就越接近最优鉴别器
最小化生成器， $G$ 的分布就越接近真实分布
但是如果 $G$ 的分布和真实分布几乎没有重叠的部分
生成器的损失就会趋于一个常数
证明：
因为几乎没有重叠，所以，对于 $x,p_{r}\neq 0$ 时， $p_{g}\to 0 ,p_{g}\neq 0$ 时， $p_{r}\to 0$
进而 $J S$ 散度为 $0$ 生成器损失为常数 $\log 2$ ,梯度为 $0$ ，就无法训练了
对于公式3
$\begin{aligned} &\quad D_{KL} \left(p_{g}|| p_{r} \right ) \\ &= E_{p_{g}} \left( \log \frac{p_{g}}{p_{r}} \right )\\ &= E_{p_{g}} \left( \log \frac{\frac{p_{g}}{p_{r}\left(x \right )+p_{g}\left(x \right )}}{\frac{p_{r}}{p_{r}\left(x \right )+p_{g}\left(x \right )}} \right )\\ &= E_{p_{g}} \left(\log \frac{1-D^{*}\left(x \right )}{D^{*}\left(x \right )} \right )\\ &= E_{p_{g}}\left( \log \left(1-D^{*} \left(x \right ) \right ) \right ) - E_{p_{g}} \log \left( D^{*} \left(x \right ) \right ) \end{aligned}$
所以
$\begin{aligned} &\quad E_{p_{g}} \left(- \log \left(D^{*} \left(x \right ) \right ) \right ) \\ &= D_{KL} \left(p_{g} || p_{r} \right ) - E_{p_{g}} \left( \log \left(1- D^{*} \left(x \right ) \right ) \right )\\ &= D_{KL} \left(p_{g} || p_{r} \right ) - 2JSD\left(p_{r}||p_{g} \right )+2\log \left(2 \right )+E_{p_{r}} \left( \log \left( D^{*} \left(x \right ) \right ) \right ) \end{aligned}$
后面两项训练生成器时相当于常数
所以就等价于前两项
最小化KL散度时JS散度就会变大
这个就矛盾了，又要让他们相似，又要拉远

参考
https://blog.csdn.net/Invokar/article/details/88917214

Nightmare004

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
打赏
0
评论
Gan损失函数问题

生成器G(x)G(x)G(x)鉴别器D(x)D(x)D(x)rrr是真实的数据zzz是噪声ggg是生成器的分布鉴别器损失函数设为公式（1）lossD(x)=−Ex∼pr(x)(log⁡(D(x)))−Ez∼pz(z)(log⁡(1−D(G(z))))=−Ex∼pr(x)(log⁡(D(x)))−Ex∼pg(x)(log⁡(1−D(x)))\begin{aligned}&\quad loss_{D} \left(x \right )\\&=- E_{x \sim p_{r}
复制链接

扫一扫