GAN: 原始损失函数详解

最新推荐文章于 2024-08-24 11:36:16 发布

ch_shijie

最新推荐文章于 2024-08-24 11:36:16 发布

阅读量3.2k

点赞数 1

文章标签： python 机器学习深度学习

原文链接：https://www.cnblogs.com/walter-xh/p/10051634.html

版权

本文详细解读了GAN（生成对抗网络）的原始损失函数，通过二进制交叉熵形式揭示其训练策略，包括D（判别器）的maxD和G（生成器）的minG。讲解了如何通过调整标签迷惑判别器来优化模型，并最终推导出与JS散度的关系。

摘要由CSDN通过智能技术生成

函数详解：（文末有原理推导，不想看可直接跳过）
　　GAN的原始损失函数，咋一看是非常难以理解的，但仔细理解后就会发现其简洁性和丰富的含义。

损失函数定义：

损失函数定义

一切损失计算都是在D（判别器）输出处产生的，而D的输出一般是fake/true的判断，所以整体上采用的是二进制交叉熵函数。

左边包含两部分minG和maxD。

首先看一下maxD部分，因为训练一般是先保持G（生成器）不变训练D的。D的训练目标是正确区分fake/true，如果我们以1/0代表true/fake，则对第一项E因为输入采样自真实数据所以我们期望D(x)趋近于1，也就是第一项更大。同理第二项E输入采样自G生成数据，所以我们期望D(G(z))趋近于0更好，也就是说第二项又是更大。所以是这一部分是期望训练使得整体更大了，也就是maxD的含义了。

第二部分保持D不变，训练G，这个时候只有第二项E有用了，关键来了，因为我们要迷惑D，所以这时将label设置为1(我们知道是fake，所以才叫迷惑)，希望D(G(z))输出接近于1更好，也就是这一项越小越好，这就是minG。当然判别器哪有这么好糊弄，所以这个时候判别器就会产生比较大的误差，误差会更新G，那么G就会变得更好了，这次没有骗过你，只能下次更努力了。
　　
　　实现：训练的时候需要将D的损失函数设为上式的相反数，再进行损失函数的最小化即可。
转载：https://www.cnblogs.com/walter-xh/p/10051634.html

公式推导：
在原始的GAN中，提出的loss是：

[公式]

当G固定且运算可逆时（实际上这一点一般不成立，但不影响了解GAN的思想）：

[公式]

代入loss公式，进而有：

[公式]

对于积分区间内的每一个x，设被积函数为f 为：

[公式]
注意这里x是固定的，变量是D。对f求导，得到当
在这里插入图片描述
时，f存在最大值。

由于被积函数的最大值对于任意x都成立，所以当
[公式]
时， V(D, G)有最大值。

代入loss公式，有:
在这里插入图片描述

可见，GAN的loss实际上就是JS散度（JS散度可自行百度）。

关注

1
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。