生成对抗网络GAN基本原理

最新推荐文章于 2024-04-24 19:30:06 发布

头发没了还会再长

最新推荐文章于 2024-04-24 19:30:06 发布

阅读量410

点赞数 1

分类专栏：机器学习深度学习文章标签：生成对抗网络人工智能深度学习

本文链接：https://blog.csdn.net/m0_51474171/article/details/126909257

版权

机器学习深度学习专栏收录该内容

42 篇文章 7 订阅

订阅专栏

参考网站：点我)
GAN的设计动机就是自动化
监督学习：训练时需要的数据集是人工标注的，但这种数据集难以获取且成本高昂。GAN能自动判断进行标注，且可以自动优化，效率很高且成本很低。
人工判断生成结果的好坏——自动判断和优化

生成对抗网络GAN的基本原理

有助于理解的一个小故事~

假设一个城市治安混乱，很快，这个城市里就会出现无数的小偷。在这些小偷中，有的可能是盗窃高手，有的可能毫无技术可言。假如这个城市开始整饬其治安，突然开展一场打击犯罪的“运动”，警察们开始恢复城市中的巡逻，很快，一批“学艺不精”的小偷就被捉住了。之所以捉住的是那些没有技术含量的小偷，是因为警察们的技术也不行了，在捉住一批低端小偷后，城市的治安水平变得怎样倒还不好说，但很明显，城市里小偷们的平均水平已经大大提高了。
警察们开始继续训练自己的破案技术，开始抓住那些越来越狡猾的小偷。随着这些职业惯犯们的落网，警察们也练就了特别的本事，他们能很快能从一群人中发现可疑人员，于是上前盘查，并最终逮捕嫌犯；小偷们的日子也不好过了，因为警察们的水平大大提高，如果还想以前那样表现得鬼鬼祟祟，那么很快就会被警察捉住。
为了避免被捕，小偷们努力表现得不那么“可疑”，而魔高一尺、道高一丈，警察也在不断提高自己的水平，争取将小偷和无辜的普通群众区分开。随着警察和小偷之间的这种“交流”与“切磋”，小偷们都变得非常谨慎，他们有着极高的偷窃技巧，表现得跟普通群众一模一样，而警察们都练就了“火眼金睛”，一旦发现可疑人员，就能马上发现并及时控制——最终，我们同时得到了最强的小偷和最强的警察。

专业点来讲，GAN由两个重要部分组成：

生成器(Generator)：通过机器生成数据（大部分情况下是图像），目的是“骗过”判别器
判别器(Discriminator)：判断这张图像是真实的还是机器生成的，目的是找出生成器做的“假数据”

（这里的生成器就相当于故事里的小偷，判别器就是故事里的警察）
详细过程：
第一阶段：固定“判别器D”，训练“生成器G”

我们使用一个还 OK 判别器，让一个“生成器G”不断生成“假数据”，然后给这个“判别器D”去判断。

一开始，“生成器G”还很弱，所以很容易被揪出来。

但是随着不断的训练，“生成器G”技能不断提升，最终骗过了“判别器D”。

到了这个时候，“判别器D”基本属于瞎猜的状态，判断是否为假数据的概率为50%。

第二阶段：固定“生成器G”，训练“判别器D”

当通过了第一阶段，继续训练“生成器G”就没有意义了。这个时候我们固定“生成器G”，然后开始训练“判别器D”。
“判别器D”通过不断训练，提高了自己的鉴别能力，最终他可以准确的判断出所有的假图片。
到了这个时候，“生成器G”已经无法骗过“判别器D”。

循环阶段一和阶段二

通过不断的循环，“生成器G”和“判别器D”的能力都越来越强。
最终我们得到了一个效果非常好的“生成器G”，我们就可以用它来生成我们想要的图片了。
下面的实际应用部分会展示很多“惊艳”的案例。

GAN的优缺点

优：

能更好建模数据分布（图像更锐利、清晰）
理论上，GANs 能训练任何一种生成器网络。其他的框架需要生成器网络有一些特定的函数形式，比如输出层是高斯的。
无需利用马尔科夫链反复采样，无需在学习过程中进行推断，没有复杂的变分下界，避开近似计算棘手的概率的难题。

缺：

难训练，不稳定。生成器和判别器之间需要很好的同步，但是在实际训练中很容易D收敛，G发散。D/G 的训练需要精心的设计。
模式缺失（Mode Collapse）问题。GANs的学习过程可能出现模式缺失，生成器开始退化，总是生成同样的样本点，无法继续学习。

GAN的十三种应用

生成图像数据集
人工智能的训练是需要大量的数据集的，如果全部靠人工收集和标注，成本是很高的。GAN 可以自动的生成一些数据集，提供低成本的训练数据。
在这里插入图片描述
生成人脸照片
生成人脸照片是大家很熟悉的应用，但是生成出来的照片用来做什么是需要思考的问题。因为这种人脸照片还处于法律的边缘。

生成照片、漫画人物
GAN 不但能生成人脸，还能生成其他类型的照片，甚至是漫画人物。
在这里插入图片描述