到底什么是生成式对抗网络GAN？

最新推荐文章于 2024-08-08 08:00:00 发布

csdn_csdn__AI

最新推荐文章于 2024-08-08 08:00:00 发布

阅读量1.3k

点赞数 1

文章标签： GAN WGAN 半监督学习 DCGAN

本文链接：https://blog.csdn.net/heyc861221/article/details/80129461

版权

本文介绍了生成式对抗网络（GAN）的工作原理，将其比喻为摄影师与女朋友之间的互动，解释了生成模型与判别模型的博弈过程。GAN在图像生成如DCGAN中的应用以及在半监督学习中的作用也被探讨。此外，还提到了WGAN对原始GAN的改进，解决了训练中的问题。GAN的未来展望包括其在多个领域的潜力应用。

摘要由CSDN通过智能技术生成

男：哎，你看我给你拍的好不好？
女：这是什么鬼，你不能学学XXX的构图吗？
男：哦
……
男：这次你看我拍的行不行？
女：你看看你的后期，再看看YYY的后期吧，呵呵
男：哦
……
男：这次好点了吧？
女：呵呵，我看你这辈子是学不会摄影了
……
男：这次呢？
女：嗯，我拿去当头像了

上面这段对话讲述了一位“男朋友摄影师”的成长历程。很多人可能会问：这个故事和生成式对抗网络（GAN）有什么关系？其实，只要你能理解这段故事，就可以了解生成式对抗网络的工作原理。

首先，先介绍一下生成模型（generative model），它在机器学习的历史上一直占有举足轻重的地位。当我们拥有大量的数据，例如图像、语音、文本等，如果生成模型可以帮助我们模拟这些高维数据的分布，那么对很多应用将大有裨益。

针对数据量缺乏的场景，生成模型则可以帮助生成数据，提高数据数量，从而利用半监督学习提升学习效率。语言模型（language model）是生成模型被广泛使用的例子之一，通过合理建模，语言模型不仅可以帮助生成语言通顺的句子，还在机器翻译、聊天对话等研究领域有着广泛的辅助应用。

那么，如果有数据集S={x1，…xn}，如何建立一个关于这个类型数据的生成模型呢？最简单的方法就是：假设这些数据的分布P{X}服从g(x;θ)，在观测数据上通过最大化似然函数得到θ的值，即最大似然法：

图片描述

GAN的工作原理是这样的

文章开头描述的场景中有两个参与者，一个是摄影师（男生），一个是摄影师的女朋友（女生）。男生一直试图拍出像众多优秀摄影师一样的好照片，而女生一直以挑剔的眼光找出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。于是两者的交流过程类似于：男生拍一些照片 ->女生分辨男生拍的照片和自己喜欢的照片的区别->男生根据反馈改进自己的技术，拍新的照片->女生根据新的照片继续提出改进意见->……，这个过程直到均衡出现：即女生不能再分辨出“自己男朋友”拍的照片和“别人家的男朋友”拍的照片的区别。

我们将视线回看到生成模型，以图像生成模型举例。假设我们有一个图片生成模型（generator），它的