生成对抗网络gan原理_什么是生成对抗网络 (GAN)

生成模型(Generative Model) vs 判别模型(Discriminant Model)

在讨论生成对抗网络之前,我们需要先明确两个概念: 生成模型和判别模型。

8cd9bd19a3dd4208942a71e7940748f8

所谓生成网络,指构建生成模型的神经网络;同理判别网络则是构建判别模型的神经网络。

机器学习/深度学习模型所的一个主要任务就是:根据事物的属性(X)预测事物的标记(Y)。生成模型和判别模型,都能完成这个任务,但具体方法不同。

生成式模型会求取X和不同的Y之间的联合概率:P(Y1,X),P(Y2,X),P(Y2,X),..., P(Yn,X),然后选取其中与X联合概率最大的那个Yi,将其作为预测结果。

判别式模型来则会求以X为条件的Y的条件概率:P(Y|X),针对特定X直接得出P(Y|X)的结果,如果这个值大于某个阈值,则可以直接将其作为预测结果。

生成对抗网络(Generative Adversarial Networks,GAN)

那么,什么是生成对抗网络呢?

简单而言,生成对抗网络 是一种无监督学习方法 , 该方法由Goodfellow等人在2014年提出。

b06a7b5302d941d7bb15fb838fb45863

这 个方法 通过两个网络——一个是生成网络,另一个是判别网络——的相互制约来实现训练过程。

生成对抗网络中的生成网络G和判别网络D分别好像是假币团伙和警察——G努力使假币和真币更接近,而D则努力把假币从真币中区分出来。

bc87eb6688be418ba90fbcb1e9b54404

通过G和D的对抗,最终使得两者的模型准确度都得到提升。

生成对抗网络结构

下图是一个以手写数字生成为目标的原始的GAN网络结构,可以它由Generator生成器和Discriminator判别器组成。

ba42757e6987417aaad899904a124314

生成器用于从噪音中生成一幅手写数字的图片,而判别器则努力将训练集图片和生成器生成的假图片区分开来。

可以证明,当网络的能力足够的时候,生成器最终会生成和训练集特征相同的图像。具体的训练步骤如下(来自原论文中伪代码):

 for num_of_training_iterations: for k_steps: #k在这里是超参数,代表每个迭代对判别器做几次优化 从训练集中随机选取m幅图像 随机选取(生成)m个噪声图片 更新判别器参数(普通神经网络训练过程,例如交叉熵误差函数和随机梯度下降)  随机选取m个噪声图片 更新生成器参数

其实在GAN的论文中主要是提出了利用生成器和判别器相互制约的思路,而非详细的模型结构。上面的训练方法只是一种示例方法,生成器和判别器也不必是申请网络。

生成对抗网络的优势和劣势

GAN的优势和劣势总结如下:

CONs:

1. 网络自由度太高,训练难度大2. 两个模型是分开更新的,所以带来了两个模型之间的同步问题。如果一个模型训练的过快,会影响另一个模型的训练。

PROs:

1. 只使用反向传播即可完成训练,不使用何马尔可夫链来训练。2. GAN可以和大部分现有的生成网络算法相结合使用,提高性能。

从实际应用中,模型难以训练是困扰很多研究人员最大的问题。不过在提出GAN的论文发布(2014年)以来,大量GAN改进方法被提出,较好的解决了GAN中存在的问题,使得图像生成任务达到了可以商业应用的成熟度。

生成对抗网络主要应用举例

前面说了生成对抗网络。经过几年的研究已经比较成熟,可以进行商业应用。下面就列举了几个比较有名的开源应用案例:

  1. zi2zi:一个变换中文字体的应用,基于pix2pix
fcbdd07d88dd462c9878c48b692ce94a
  1. iGAN:我管他叫神笔马良,一个adobe和伯克利联合发布的图像增强网络,能从简笔画生成一个真实度很高的图像。
be49e7be6f4a43dfb3604d8c30fd5026
  1. domain-transfer-network: 感觉和CNN中的风格迁移类似,实现的功能类似脸萌,可以从真实头像生成卡通头像
29258e29337849f191244cbc67feb19d
  1. neural-enhance: 将低分辨率图像处理成高分辨率图像,以后各种游戏炒冷饭,电影重制版的成本可以大大降低了。。。。
32feac89b8fb4a33876726fbf645edb5
  1. deepfake: 前一阵引起轩然大波的现象级应用,可以给视频换脸,应用场景很多
5e6b7f197896460fa10409cc23c24d54

类似的应用还有很多,而且也达到了不错的效果。个人感觉GAN真的是一个很有钱途的领域。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值