GAN数学原理及代码实现

最新推荐文章于 2024-06-17 13:08:59 发布

Galaxen

最新推荐文章于 2024-06-17 13:08:59 发布

阅读量1k

点赞数 1

文章标签：生成对抗网络深度学习人工智能

本文链接：https://blog.csdn.net/weixin_44909476/article/details/130953664

版权

本文深入探讨了生成对抗网络（GANs）的工作原理，包括生成器与判别器的角色，条件GAN，以及背后的数学理论如KL和JS散度。文章详细介绍了训练技巧如LSGAN和WGAN，并展示了GAN在生成卡通头像和image-to-image模型中的应用。

摘要由CSDN通过智能技术生成

GAN

generator 和discriminator

生成式对抗网络(Generative Adversarial Networks, GAN)，包括生成器 generator 和判别器 discriminator。

生成器（generator）是一个神经网络，根据不同的输入向量可以生成不同特征的图像或者语音等。

判别器 (discriminator)也是一个神经网络，其输入是 generator 的输出，输出为一个标量。discriminator 用于判别 generator 的输出和真实数据的相似情况。输出的标量值越大，对应的 generator 生成的图片更加真实。
在这里插入图片描述
最开始，generator 产生了一堆近似噪声的东西，训练 discriminator 并固定 generator 使得其能够判别 generator 产生的和数据集中图片的区别。

接下来固定 discriminator，来训练 generator 使得 generator 生成的图像可以骗过 discriminator。

如此循环迭代，直到 generator 的图像满意为止。

GAN 中的训练算法可以表述为如下：
在这里插入图片描述
上图中，蓝色的框表示 discriminator 的训练，红色框表示 generator 的训练。输入到 generator 中的向量 $z$ $可以从一个分布中随机采样得到。它和数据集中的数据 $x$ 并没有直接的关系， $\widetilde{x}$ 表示生成的数据。
下面重点来探讨两个 $\widetilde{V}$ 的函数。需要调整参数使得 $\widetilde{V}$ 最大，因此使用的是梯度上升的方法而不是梯度下降，所以参数更新那里会有一个负号的差距。

对于判别器，当判别器的输入为数据集中的真实图片，那么 $D(x^i)$ 越大，对应的 $\widetilde{V}$ 将增大，而对于生成器产生的数据 $\widetilde{x}$ 越小，对应的 $\widetilde{V}$ 增大。这样判别器优化的最终结果是对于数据集中的数据，会给出一个很高的分数（接近 1），而对于生成器生成的数据，则给出很低的分数。
对于生成器，优化目标依然是使得 $\widetilde{V}$ 最大，但是需要固定住判别器。这样的训练的最终结果是生成器骗过判别器，使得生成的数据经过判别器输出接近 1。