生成对抗网络GAN损失函数loss的简单理解

xiongxyowo

已于 2022-08-02 11:39:19 修改

阅读量1.7w

点赞数 31

分类专栏：基础文章标签：划水

于 2021-09-26 18:23:18 首次发布

本文链接：https://blog.csdn.net/qq_40714949/article/details/120493934

版权

基础专栏收录该内容

21 篇文章

订阅专栏

该博客深入解析了GAN（生成对抗网络）的损失函数，详细介绍了判别器D和生成器G的训练目标。D的目标是最大化真实样本的识别概率和最小化虚假样本的误判概率，而G则相反，旨在生成更逼真的样本以降低D的辨别能力。训练过程中，D和G交替优化，以达到生成器生成难以区分真假的样本状态。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原始的公式长这样：
$\min _{G} \max _{D} V(D, G)=\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 首先可以明确一点，这种公式肯定是从里面算到外面的，也就是可以先看这一部分： $\max _{D} V(D, G)=\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]+\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 我们知道，在每个epoch中，GAN的生成器与判别器是分别训练的，即先固定生成器 $G$ ，去训练判别器 $D$ ，那么上面这个式子实际上就是判别器的"损失函数"。继续拆分上面这个式子，可以发现主要就是加号左右两个部分。

先看左边。左边这一部分的作用是保证判别器的基础判断能力：对于 $\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]$ ， $\boldsymbol{x}$ 为从真实数据分布 $p_{\text {data }}$ 中采样得到的样本。 $\mathbb{E}_{\boldsymbol{x} \sim p_{\text {data }}(\boldsymbol{x})}[\log D(\boldsymbol{x})]$ 越大，相当于意味着 $D(\boldsymbol{x})$ 越大，即判别器越能准确地将真实样本识别为真实样本；因此有 $max _{D}$ ；

再看右边。右边这一部分的作用是保证判别器能够区分出虚假样本：对于 $\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ ， $\boldsymbol{z}$ 为从某一特定分布 $p_{\boldsymbol{z}}$ 中得到的采样， $G(\boldsymbol{z})$ 为生成器生成的虚假样本。 $\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 越大，相当于意味着 $D(G(\boldsymbol{z}))$ 越小，即判别器越能够正确区分虚假样本，将其标为False；因此有 $max _{D}$ 。

再来看生成器G的"损失函数"。到了训练生成器G的阶段，此时判别器D固定。如果G更强，那么判别器会进行误判，此时 $D(G(\boldsymbol{z}))$ 会变大， $\mathbb{E}_{\boldsymbol{z} \sim p_{\boldsymbol{z}}(\boldsymbol{z})}[\log (1-D(G(\boldsymbol{z})))]$ 更接近于零，即整个式子的值会更小；因此有 $min _{G}$ 。