初识GAN

最新推荐文章于 2019-09-13 12:01:14 发布

于建民

最新推荐文章于 2019-09-13 12:01:14 发布

阅读量1.2k

点赞数

分类专栏：技术博客文章标签：对抗学习 GANs 最大似然估计关系

本文链接：https://blog.csdn.net/yujianmin1990/article/details/77620163

版权

本文介绍了生成对抗网络（GAN）的基本概念，包括对抗网络、最大似然参数估计及其与最大似然的关系。阐述了GAN的优化目标，详细解析了对抗学习过程中的学习机制、有效性原因及优缺点，并探讨了训练过程的收敛性。同时，文章提出了对多方对抗和纳什均衡的思考。

摘要由CSDN通过智能技术生成

前言

　　简单认识下GAN，GAN与最大似然的关系，几个基本概念的介绍

GAN

对抗网络

　　GAN的思想，一个判别模型D，一个生成模型G组成对抗网络。如何对抗呢？ D的目的是尽量识别出G生成的样本， $D(x)$ 表示样本被判断为真实数据的概率；G的目的是尽量让D无法识别自己生成的样本。
　　生成对抗网络的D之优化函数：

V (G, D) = E x \sim p d a t a [l n D (x)] + E x \sim p g [l n (1 - D (x))]

$V(G,D) = E_{x \sim p_{data}}[ln D(x)] + E_{x \sim p_{g}}[ln (1-D(x))]$
　　这个优化函数是怎么来的呢？ 本质是最大似然参数估计。

最大似然参数估计

　　先来回顾下最大似然估计问题，以二分类为例。
　　样本总是唯一地属于某个类1/0，假设正样本标记为1，负样本标记为0。
　　在一个样本在label已知时，则样本为类别y=label的概率为：

P (y | x; θ) = [P (y = 1 | x; θ)] T [y = 1] * [1 - P (y = 1 | x; θ)] T [y = 0]

$P(y|x;\theta)=[P(y=1|x;\theta)]^{T[y=1]}*[1-P(y=1|x;\theta)]^{T[y=0]}$
　　其中

T[⋅] $T[·]$ 表示判断是否为真，真则=1，假则=0。样本类别具有唯一性，故T[Y]也表示了随机变量

Y $Y$ 发生的概率( Import)，发生时概率为1，不发生时概率为0，这个特点将交叉熵和最大似然完美统一起来（对这里要解释地没用可以忽略）。
　　最大似然估计参数的思想是：选择某参数

θ $\theta$ ，使得，当前样本集出现的总体概率

L(D;θ)=P(Y|D;θ) $L(D;\theta)=P(Y|D;\theta)$ 最大，即：

m a x θ {P (Y | D; θ)} = m a x θ {\prod i m P (y i | x i; θ)}

$\underset{\theta} {max} \{P(Y|D;\theta)\} = \underset{\theta} {max} \{ \prod_{i}^{m} P(y_i|x_i;\theta) \}$

= = > 等 价 于 m a x {L n [L (D; θ)]} = m a x {\sum i m ln P (y i | x i; θ)}

$\underset {等价于}{==>} max \{ Ln[L(D;\theta)] \} = max \{ \sum_{i}^{m} \ln P(y_i|x_i; \theta) \}$

\propto m a x {1 m \sum i m ln P (y i | x i; θ)} \approx E x \sim p 真 实 分 布 [ln P (y i | x i; θ)]

$\propto max \{ \frac{1}{m} \sum_i^m \ln P(y_i|x_i;\theta) \} \approx E_{x \sim p_{真实分布}}[\ln P(y_i|x_i;\theta)]$
　　最后一步：对某随机变量而言，其总体期望可以用样本的均值估计。

V(G,D) 与ML 关系

　　对抗网络的样本来自真实数据 $x_i$ 和生成数据 $G(z_i)$ ，天然分裂为label=1（当 $x_i \in data$ 时）和label=0（当 $x_i \in G(z_i)$ 时），判别器判别某样本类型y=label的概率函数可以表示为 $P(y|x;(\theta_d))$ ，生成器的模型表示为 $G(z)$ ，其中 $z$ 为随机噪声。
　　其样本集判别为各自类别的总概率：