生成对抗网络（GAN）

最新推荐文章于 2024-01-14 21:05:19 发布

Sun7_She

最新推荐文章于 2024-01-14 21:05:19 发布

阅读量4.9k

点赞数

分类专栏：深度学习文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Sun7_She/article/details/58585524

版权

深度学习专栏收录该内容

44 篇文章 0 订阅

订阅专栏

最新的文章从根本上论证了原本的loss function错在哪里，以及如何修改loss function

简单来说，gan包含一个生成器和一个判别器。

生成器用于生成与真实图片同类型的图片

判别器用于判断输入的图片是来自生成器还是真实图片，如果判断概率都是0.5，则说明区分不出，则生成器是好的

保持生成器不变，训练判别器。保持判别器不变，训练生成器。交替训练

我们的最终目的是留下生成器，用于生成一堆很真的假图片 -.-

网络架构如下图所示：

图片来自

http://www.tuicool.com/articles/6R3UJjQ

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

这篇文章找到了原始gan的缺点并对其改进。

https://zhuanlan.zhihu.com/p/25071913?from=timeline&isappinstalled=0

这是wgan的源码实现

https://github.com/martinarjovsky/WassersteinGAN

对原始gan的改进有以下4点，使得训练更为稳定，生成的图片种类更加多样，详细解释参见知乎文章：

判别器最后一层去掉sigmoid
生成器和判别器的loss不取log
每次更新判别器的参数之后把它们的绝对值截断到不超过一个固定常数c
不要用基于动量的优化算法（包括momentum和Adam），推荐RMSProp，SGD也行

关于文章中提到的两种loss function，多解释几句：

问题1. 等价优化的距离衡量（KL散度、JS散度）不合理（不合理的方案本来就不对，我们就不讨论解决方案了，因为从根本上，公式就是错的）

问题2. 生成器随机初始化后的生成分布很难与真实分布有不可忽略的重叠。

解决方案，就是对生成样本和真实样本加噪声，直观上说，使得原本的两个低维流形“弥散”到整个高维空间，强行让它们产生不可忽略的重叠。而一旦存在重叠，JS散度就能真正发挥作用，此时如果两个分布越靠近，它们“弥散”出来的部分重叠得越多，JS散度也会越小而不会一直是一个常数，于是（在第一种原始GAN形式下）梯度消失的问题就解决了。在训练过程中，我们可以对所加的噪声进行退火（annealing），慢慢减小其方差，到后面两个低维流形“本体”都已经有重叠时，就算把噪声完全拿掉，JS散度也能照样发挥作用，继续产生有意义的梯度把两个低维流形拉近，直到它们接近完全重合。以上是对原文的直观解释。

最后放一张看知乎上解释wgan的文章的笔记图，防止自己搞丢，以后有空可以看看，写得不好，建议看原文，思路更清晰

wgan文章链接：https://arxiv.org/pdf/1701.07875.pdf

早知道要上传就好好写了..哭晕T.T

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
生成对抗网络（GAN）

这篇文章找到了原始gan的缺点并对其改进。https://zhuanlan.zhihu.com/p/25071913?from=timeline&isappinstalled=0这是wgan的源码实现https://github.com/martinarjovsky/WassersteinGAN简单来说，gan包含一个生成器和一个判别器。生成器用于生成与真实图片
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。