GAN是我在研究领域中最为喜欢的一个。它是一种生成式模型,其基本原理是建立一个生成器和一个判别器来协同工作。
生成器的作用是从随机噪声中生成图像,判别器的作用是判断一张图像是否为真实的图像还是生成器生成的图像。这两个模型交替进行训练,生成器希望自己生成的图像可以骗过判别器,判别器则希望自己可以准确地判断真实图像和生成图像的区别。
在数学上,我们可以用以下公式来表示GAN的目标函数:(理解就成,更多太难了,不影响使用)
其中 G是生成器模型,D是判别器模型,z是输入的随机噪声,Pdata 是真实数据的分布,Pz 是随机噪声的分布。目标函数的目标是使得判别器最大化真实数据的概率,并最小化生成数据的概率,而生成器则希望最大化生成数据被判别为真实数据的概率。
在实际的训练过程中,我们可以使用随机梯度下降算法来最小化目标函数。当训练完成后,生成器就可以从随机噪声中生成与真实数据类似的图像。
这就是GAN的数学原理,从整理上看容易理解,但实操的时候还是没太大用,哈哈…… 不过毕竟数学理论是深度学习中非常重要的一部分,要多加分析。