理解原始Gan Loss 和 Hinge Gan Loss

daimashiren

已于 2023-05-03 22:52:08 修改

阅读量6.3k

点赞数 8

分类专栏：深度学习文章标签：深度学习机器学习人工智能

于 2022-03-04 16:16:02 首次发布

本文链接：https://blog.csdn.net/daimashiren/article/details/123279408

版权

深度学习专栏收录该内容

14 篇文章

订阅专栏

本文详细解读了GAN Loss的优化目标及其工作原理，并介绍了Hinge GAN Loss的结合，涉及判别器和生成器的训练策略。通过比较和Hinge Loss的关系，阐述了如何通过调整判别器和生成器的损失函数来提升模型性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原始Gan Loss

$\mathop{min}\limits_{G}\space \mathop{max}\limits_{D}\space V(D,G) = E_{x\sim P_{data}}[log\space D(x)] + E_{z \sim P_z \space (Z)}[log(1-D(G(Z)))]$

该Loss的目标是同时优化两个对立的目标，即maximize V(D)和minimize V(G).

首先，最大化V(D)时，函数图像分别为

因此，要想最大化V(D)，只需要D(x) → 1，D(G(Z)) → 0 (注: 原始GAN Loss中判别器D 的输出需要经过Sigmoid 的函数，故其输出的值为 0 ~ 1) 即可，即使得对于真实图像Discriminator的输出概率D(x)趋近于1，而对于生成的图像Discriminator的输出概率接近于0，便可实现最大化V(D)从而优化判别器的目的。

其次，要优化Generator，便要最小化 V(G)，由于公式的中第一项 $E_{x\sim P_{data}}[log\space D(x)]$ 不含G，因此只需最小化 $E_{z \sim P_z \space (Z)}[log(1-D(G(Z)))$ 即可，由函数图像可知，最小化 V(G)只需要让D(G(Z)) →1即可。分别训练生成器和判别器一段时间，再联合进行训练，即可实现Gan网络的优化过程。

Hinge Gan Loss

Hinge Gan Loss是Hinge Loss 和传统 Gan Loss的一个结合，首先理解Hinge Loss.

$H in g e L oss = ma x (0, 1 - t y)$ 的图像如上图所示， $\geqq 1$ 的部分都变为了0 ，其中 $t$ 表示期望的输出标签 $\pm 1$ ,而y 表示SVM的直接输出如 $y = w * x + b$ 。也可以用以下公式进行表示:
$\begin{cases} 1- ty \hspace{2em} ,if \hspace{1em} ty<1 \\0 \hspace{4em},otherwise\end{cases}$
以上公式的含义是，如果预测的标签是正确的(即t 与 y 同号)，且 ${y}\vert$ >1 时，loss为 0

若预测的标签是错误的(即t 与 y 异号)，则loss 随着 y 线性增长。类似的，当 ${y}\vert$ <1时，即使 t 与y 同号(分类正确)，但还是会因为间距不足仍然产生损失。

Hinge Loss 变种

Hinge Loss还有以下变种:
$L(y,\hat y) = max(0,m-y+\hat y)$
其中: $y$ 表示正(真实)样本得分， $\hat y$ 表示负(预测)样本得分，m表示正负样本的最小间距(margin).

Hinge Loss的目标是尽力拉大正负样本的得分差距，在以上变种中正负样本的的得分间距最小要满足margin条件(假设在一个分类问题中，机器什么也没学到，对于每个类都给出一样的分数，这个时候margin的存在就有作用了，使得loss至少是m, 而不至于是0)。

Hinge Gan Loss

$V(D,G) = L_D + L_G$

$L_D = E[max(0,1-D(x))] + E[max(0,1+D(G(z)))]$
优化目标： D(x) → 1，D(G(z)) → -1

对于判别器来说，只有 $D (x) < 1$ (真实样本的概率小于1)和 $D (G (z)) > - 1$ (伪造样本的概率大于0)这两种情况会产生loss，需要被优化，其余情况loss为0，从而一定程度上稳定了判别器的训练。
$L_{G} = -E[D(G(z))]$
优化目标: D(G(z)) → 1