GAN入门知识

最新推荐文章于 2024-05-21 22:11:21 发布

junlaii

最新推荐文章于 2024-05-21 22:11:21 发布

阅读量410

点赞数

分类专栏： gan 文章标签：生成对抗网络人工智能

本文链接：https://blog.csdn.net/qq2474842866/article/details/128348611

版权

gan 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

GAN入门知识

结构

正式说 GAN 之前我们先说一下判别式模型和生成式模型。

判别器

判别式模型判别式模型，即 Discriminative Model，又被称为条件概率模型，它估计的是条件概率分布(conditional distribution)，
p(class|context) 。

举个例子，我们给定(x,y)对，4个样本。(1,0), (1,0), (2,0),
(2,1)，p(y|x)是事件x发生时y的条件概率，它的计算如下：

生成器

即 Generative Model ，生成式模型，它估计的是联合概率分布（joint probability
distribution），p(class,context)=p(class|context)*p(context)
。p(x,y)，即事件x与事件y同时发生的概率。同样以上面的样本为例，它的计算如下：

常见模型

常见的判别式模型有 Logistic Regression，Linear Regression，SVM，Traditional Neural
Networks Nearest Neighbor，CRF 等。

常见的生成式模型有 Naive Bayes，Mixtures of Gaussians， HMMs，Markov Random Fields
等。

得分点：（CV 面试中会出现）

两者比较

判别式模型，优点是分类边界灵活，学习简单，性能较好；缺点是不能得到概率分布。

生成式模型，优点是收敛速度快，可学习分布，可应对隐变量；缺点是学习复杂，分类性能较差。

基本原理与数学推理

GAN，即Generative adversarial net，它同时包含判别式模型和生成式模型，一个经典的网络结构如下：
在这里插入图片描述
损失函数

GAN的原理很简单，它包括两个网络，一个生成网络，不断生成数据分布。一个判别网络，判断生成的数据是否为真实数据。上图是原理展示，黑色虚线是真实分布，绿色实线是生成模型的学习过程，蓝色虚线是判别模型的学习过程，两者相互对抗，共同学习到最优状态。

存在最优解证明

在这里插入图片描述

D是判别器，它的学习目标，是最大化上面的式子，而G是生成器，它的学习目标，是最小化上面的式子。上面问题的求解，通过迭代求解D和G来完成。

要求解上面的式子，等价于求解下面的式子。

其中D(x)属于(0,1)，上式是alog(y) + blog(1−y)的形式，取得最大值的条件是D(x)=a/(a+b)，此时等价于下面式子。
在这里插入图片描述
如果用KL散度来描述，上面的式子等于下面的式子。优化目标与求解-4

当且仅当pdata(x)=pg(x)时，取得极小值-log4，此时d=0.5，无法分辨真实样本和假样本。

GAN从理论上，被证实存在全局最优解
在这里插入图片描述

GAN应用

数据生成

DCGAN【3】是第一个用全卷积网络做数据生成的，下面是它的基本结构和生成的数据。
在这里插入图片描述
是它的问题是不能控制生成的数字是1还是9，所以后来有了CGAN【4】,即条件GAN，网络结构如下。

条件生成的思想是朴素贝叶斯

它将标签信息encode为一个向量，串接到了D和G的输入进行训练，优化目标发生了改变。从GAN到Conditional_GAN-4与cgan类似

金字塔gan

在这里插入图片描述
利用残差网络逼近和金字塔结构，生成高清图片

风格迁移

pix2pix
在这里插入图片描述
cycle-gan【21】/dual-gan【22】则更胜一筹，不需要配对的数据集，可以实现源域和目标域的相互转换。

超分辨率重建

srgan【31】是最早使用GAN做超分辨重建的应用，它将输入从随机噪声改为低分辨率的图片，使用了残差结构和perception loss，有很大的应用价值。
在这里插入图片描述
超分辨重建可用于小脸的检测【32】，是个值得关注的方向