GAN生成对抗网络:数学原理

1. 极大似然估计

GAN用到了极大似然估计(MLE),因此我们对MLE作简单介绍。

MLE的目标是从样本数据中估计出真实的数据分布情况,所用的方法是最大化样本数据在估计出的模型上的出现概率,也即选定使得样本数据出现的概率最大的模型,作为真实的数据分布。

将真实模型用参数 θ \theta θ表示,则在模型 θ \theta θ下,样本数据的出现概率(likelihood)是 (1) ∏ i = 1 m p m o d e l ( x i ; θ ) \prod_{i=1}^mp_{model}(x_i; \theta) \tag{1} i=1mpmodel(xi;θ)(1)

其中 x i x_i xi表示样本中的第 i i i个数据。

最大化(1)式的概率,求得满足条件的 θ \theta θ
θ ∗ = arg ⁡ max ⁡ θ ∏ i = 1 m p m o d e l ( x i ; θ ) = arg ⁡ max ⁡ θ ∑ i = 1 m log ⁡ p m o d e l ( x i ; θ ) \begin{aligned} \theta^* & = \arg\max_\theta\prod_{i=1}^mp_{model}(x_i; \theta) \\ &= \arg\max_\theta\sum_{i=1}^m\log p_{model}(x_i; \theta) \\ \end{aligned} θ=argθmaxi=1mpmodel(xi;θ)=argθmaxi=1mlogpmodel(xi;θ)

还可以使用KL散度来代表MLE方法:
θ ∗ = arg ⁡ min ⁡ θ D K L ( p d a t a ( x ) ∣ ∣ p m o d e l ( x ; θ ) = arg ⁡ min ⁡ θ { ∑ i = 1 m p d a t a ( x i ) log ⁡ p d a t a ( x i ) − ∑ i = 1 m p d a t a ( x i ) log ⁡ p m o d e l ( x i ; θ ) } = − arg ⁡ min ⁡ θ ∑ i = 1 m p d a t a ( x i ) log ⁡ p m o d e l ( x i ; θ ) = arg ⁡ max ⁡ θ ∑ i = 1 m p d a t a ( x i ) log ⁡ p m o d e l ( x i ; θ ) \begin{aligned} \theta^*&=\arg\min_\theta D_{KL}(p_{data}(x) || p_{model}(x;\theta)\\ & = \arg\min_\theta\left\{ \sum_{i=1}^mp_{data}(x_i)\log p_{data}(x_i) - \sum_{i=1}^mp_{data}(x_i)\log p_{model}(x_i;\theta) \right\}\\ & = -\arg\min_\theta\sum_{i=1}^mp_{data}(x_i)\log p_{model}(x_i;\theta) \\ & = \arg\max_\theta\sum_{i=1}^mp_{data}(x_i)\log p_{model}(x_i;\theta) \end{aligned} θ=argθminDKL(pdata(x)pmodel(x;θ)=argθmin{ i=1mpdata(xi)logpdata

生成对抗网络(Generative Adversarial Networks,简称GAN)是一种用于生成模型的机器学习算法。它由两个主要组件组成:生成器(Generator)和判别器(Discriminator)。GAN数学原理可以通过以下步骤来解释: 1. 基本思想:GAN的目标是训练一个生成器网络,使其能够生成与真实数据相似的样本。为了实现这一目标,GAN引入了一个判别器网络,用于区分生成器生成的样本和真实数据。 2. 生成器网络:生成器网络接收一个随机噪声向量作为输入,并通过一系列的神经网络层将其转换为一个与真实数据相似的样本。生成器的目标是尽可能地欺骗判别器,使其无法区分生成的样本和真实数据。 3. 判别器网络:判别器网络接收生成器生成的样本和真实数据作为输入,并通过一系列的神经网络层将其转换为一个概率值,表示输入样本是真实数据的概率。判别器的目标是尽可能准确地区分生成的样本和真实数据。 4. 对抗训练:在训练过程中,生成器和判别器相互对抗。生成器试图生成更逼真的样本以欺骗判别器,而判别器试图准确地区分生成的样本和真实数据。通过反复迭代训练生成器和判别器,GAN可以逐渐提高生成器生成样本的质量。 5. 损失函数:GAN使用了两个损失函数来训练生成器和判别器。生成器的损失函数是判别器对生成的样本的判断结果与真实标签之间的差异,生成器希望最小化这个差异。判别器的损失函数是判断生成的样本和真实数据的准确性,判别器希望最大化这个准确性。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值