GAN入门知识

GAN入门知识

结构

正式说 GAN 之前我们先说一下判别式模型和生成式模型。

判别器

  1. 判别式模型 判别式模型,即 Discriminative Model,又被称为条件概率模型,它估计的是条件概率分布(conditional distribution),
    p(class|context) 。

举个例子,我们给定(x,y)对,4个样本。(1,0), (1,0), (2,0),
(2,1),p(y|x)是事件x发生时y的条件概率,它的计算如下:
在这里插入图片描述

生成器

即 Generative Model ,生成式模型 ,它估计的是联合概率分布(joint probability
distribution),p(class,context)=p(class|context)*p(context)
。p(x,y),即事件x与事件y同时发生的概率。同样以上面的样本为例,它的计算如下:
在这里插入图片描述

常见模型

常见的判别式模型有 Logistic Regression,Linear Regression,SVM,Traditional Neural
Networks Nearest Neighbor,CRF 等。

常见的生成式模型有 Naive Bayes,Mixtures of Gaussians, HMMs,Markov Random Fields
等。

得分点:(CV 面试中会出现)

两者比较

判别式模型 ,优点是分类边界灵活 ,学习简单,性能较好 ;缺点是不能得到概率分布 。

生成式模型 ,优点是收敛速度快,可学习分布,可应对隐变量 ;缺点是学习复杂 ,分类性能较差。

基本原理与数学推理

GAN,即Generative adversarial net,它同时包含判别式模型和生成式模型,一个经典的网络结构如下:
在这里插入图片描述
损失函数
在这里插入图片描述
GAN的原理很简单,它包括两个网络,一个生成网络,不断生成数据分布。一个判别网络,判断生成的数据是否为真实数据。上图是原理展示,黑色虚线是真实分布,绿色实线是生成模型的学习过程,蓝色虚线是判别模型的学习过程,两者相互对抗,共同学习到最优状态。

存在最优解证明

在这里插入图片描述

D是判别器,它的学习目标,是最大化上面的式子,而G是生成器,它的学习目标,是最小化上面的式子。上面问题的求解,通过迭代求解D和G来完成。

要求解上面的式子,等价于求解下面的式子。
在这里插入图片描述

其中D(x)属于(0,1),上式是alog(y) + blog(1−y)的形式,取得最大值的条件是D(x)=a/(a+b),此时等价于下面式子。
在这里插入图片描述
如果用KL散度来描述,上面的式子等于下面的式子。 优化目标与求解-4

当且仅当pdata(x)=pg(x)时,取得极小值-log4,此时d=0.5,无法分辨真实样本和假样本。

GAN从理论上,被证实存在全局最优解
在这里插入图片描述

GAN应用

数据生成

DCGAN【3】是第一个用全卷积网络做数据生成的,下面是它的基本结构和生成的数据。
在这里插入图片描述
是它的问题是不能控制生成的数字是1还是9,所以后来有了CGAN【4】,即条件GAN,网络结构如下。
在这里插入图片描述
条件生成的思想是朴素贝叶斯
在这里插入图片描述
它将标签信息encode为一个向量,串接到了D和G的输入进行训练,优化目标发生了改变。 从GAN到Conditional_GAN-4与cgan类似

金字塔gan

在这里插入图片描述
利用残差网络逼近和金字塔结构,生成高清图片
在这里插入图片描述

风格迁移

pix2pix
在这里插入图片描述
cycle-gan【21】/dual-gan【22】则更胜一筹,不需要配对的数据集,可以实现源域和目标域的相互转换。
在这里插入图片描述
超分辨率重建
在这里插入图片描述
srgan【31】是最早使用GAN做超分辨重建的应用,它将输入从随机噪声改为低分辨率的图片,使用了残差结构和perception loss,有很大的应用价值。
在这里插入图片描述
超分辨重建可用于小脸的检测【32】,是个值得关注的方向

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CycleGAN和StyleGANGAN(生成式对抗网络)的两个重要应用。GAN是一种深度学习模型,它可以生成新的数据,比如图片、音频等。CycleGAN和StyleGAN的区别在于它们生成数据的方式以及应用领域。 CycleGAN是一种能够将一种图像转换成另一种图像的模型,例如将马变成斑马,将夏天的图片转换成冬天的图片等。它是由两个生成器和两个判别器组成的。其中一个生成器将一种图像转换成另一种图像,另一个生成器则将转换回来。两个判别器用于判断生成的图片是否真实。CycleGAN的优点是可以无需成对的图片进行训练,而且训练数据集不需要太大,只需要一些相关的图片即可。 StyleGAN则是一种用于生成逼真的图像的模型,它是在GAN的基础上进行了改进。StyleGAN可以生成逼真的人脸、汽车、动物等图像。StyleGAN的优点是可以生成高分辨率的图像,并且可以控制图像的风格和内容。StyleGAN可以使用一个具有连续变化的潜在空间来控制所生成图像的不同部分,从而可以在不同样本之间无缝地转换,这使得生成的图像更加逼真和自然。 总之,CycleGAN和StyleGAN都是GAN的应用,CycleGAN主要用于图像的风格转换,而StyleGAN则用于逼真图像的生成。它们的成功使得生成式对抗网络的应用得到了广泛的关注,并且将继续在图像、视频和音频数据的生成和处理中发挥重要作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值