一文入门人工智能的掌上明珠：生成对抗网络（GAN）

最新推荐文章于 2024-03-20 16:50:56 发布

Geeksongs

最新推荐文章于 2024-03-20 16:50:56 发布

阅读量388

点赞数 1

分类专栏： Deep Learning 计算机视觉

本文链接：https://blog.csdn.net/Geeksongs/article/details/107777822

版权

Deep Learning 同时被 2 个专栏收录

21 篇文章 3 订阅

订阅专栏

计算机视觉

6 篇文章 0 订阅

订阅专栏

一.简介

在人工智能领域内，GAN是目前最为潮流的技术之一，GAN能够让人工智能具备和人类一样的想象能力。只需要给定计算机一定的数据，它就可以自动联想出相似的数据。我们学习和使用GAN的原因如下：

1.能够用GAN进行无监督学习：深度学习需要大量数据的标注才能够进行监督学习，而使用GAN则不需要使用大量标注的数据，可以直接生成数据进行无监督学习，比如使用GAN进行图像的语义分割，我们甚至根本不需要标注图像，计算机就可以自动对图像进行语义分割，目标检测等等。

2.使用GAN可以进行图像的风格迁移：我们可以将一段马的视频变成斑马，将一段真实世界里的视频变成动漫世界

3.使用GAN可以输入文字就输出图像：我们只需要随便对计算机说一句话，计算机就可以根据这段话想象出所对应的场景。

4.GAN：使用Gan可以恢复图像的分辨率，让图像变得更加清晰，或者去掉马赛克。比如前几个月的老北京项目，将100年前的一段北京街头的黑白视频变成了高清的彩色视频。

二.GAN的发展历史

GAN实际上从2014年才提出来，目前也只走过了6年的时间，当时Yun Lecun（LeNet-5的发明者）在Twitter上评论说GAN是人工智能领域最有顶尖的技术，但是因为在今年他所提出的去马赛克技术，因技术还不够成熟，将奥巴马（黑人）的打马赛克之后的图像去掉马赛克变成了白人，刺激了美国的种族主义者，因此把他骂退了Twitter的账号，Gan的发展历程如下：

从DCGANs开始人们第一次在生成对抗网络当中引入了深度神经网络的思想，从而让GAN的效果得到极大的提升。那么GAN的基本结构是怎么的呢？

三.生成式对抗网络的结构

生成对抗网络GAN的结构如下：

整个结构具有两个神经网络，一个是Generator神经网络，另一个则是Discriminator神经网络。Generator接受一个随机噪声（随机的一个向量的值）用于生成假的图片，Discriminator通过判定生成的图片和真实图片之间的差异来形成loss，同时在判定的时候更新自己的参数，直到能够完全分辨出假的图片和真实的图片，让loss变到最大为止。如下图所示就是一个用于生成二次元妹子头像的生成式对抗网络：

那么我们整个训练的步骤是怎样的呢？

第一步：

首先生成Fake image，然后固定住Generator，让其不更新参数，通过更新Discriminator的参数来让loss更小，这里的loss衡量的是什么呢？？假设真是的图像的label为1，生成的fake image为0，loss就是衡量的Discriminator是否将真实的图片label为1以及将假的图片衡量为0的准确度，loss因此越小越好。从而使Discriminator能够区分真的图片和假的图片。

第二步：

我们直接固定住Discriminator和Trainnig Set,更新Generator的参数，使Discriminator的loss越来越大，让Discriminator根本无法分辨。这个时候参数更新又重复之间的第一步，固定住Generator，不断地迭代。最终就可以让生成的图片完全让人类的肉眼无法分辨其真假。