Tensorflow(9): GAN,WGAN原理及实战

最新推荐文章于 2022-07-30 11:12:25 发布

weixin_51182518

最新推荐文章于 2022-07-30 11:12:25 发布

阅读量539

点赞数

文章标签： tensorflow 深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51182518/article/details/113410649

版权

本文详细介绍了GAN（生成对抗网络）和WGAN（ Wasserstein GAN）的工作原理，包括训练策略、JS散度与Wasserstein距离的比较，以及在Tensorflow中实现GAN和WGAN的实战步骤。重点讨论了Wasserstein距离如何解决GAN训练中的稳定性问题，并提供了训练技巧和反卷积在网络中的应用。

摘要由CSDN通过智能技术生成

adversarial auto-encoder和VAE都是希望在latent space上的分布可以服从某种先验分布。

1、GAN

在这里插入图片描述

通过分辨器分类real和fake，使得生成器生成的image的分布与real data的分布越来越接近。

how to train？

让分辨器分辨real和fake的能力变强
训练生成器的能力，欺骗分辨器。

在这里插入图片描述

max D
min G

important tips

D训练时，固定G
等D训练好了，训练G

在这里插入图片描述

蓝色：D的分类
绿色：生成器的分布
黑色：real data

到最后，real和生成的分布重合，D已经分辨不出来了

Q1 Where D go（fixed G）

在这里插入图片描述
对于discriminator的训练，希望将关于属于real data分布的似然函数最大，将属于生成分布的对数似然函数最小。即(1-D(x))最大。

kl divergence vs js divergence

在这里插入图片描述

Q2：where will G go(after discriminator)

在这里插入图片描述
最小化在给定分辨器下的生成器的损失函数就是最小化real data分布和生成器生成数据分布的JS divergence

$p_r=p_g$

DCGAN deconvolution GAN

在这里插入图片描述

数据升维。channel减少，h和w增多。

Transposed convolution

在这里插入图片描述

反卷积输入与输出的计算

在这里插入图片描述

2、JS 散度的缺陷

如何将h和w升维度

padding
stride

training stability

在很多情况，

最低0.47元/天解锁文章

weixin_51182518

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Tensorflow(9): GAN,WGAN原理及实战

adversarial auto-encoder和VAE都是希望在latent space上的分布可以服从某种先验分布。1、GAN通过分辨器分类real和fake，使得生成器生成的image的分布与real data的分布越来越接近。how to train？让分辨器分辨real和fake的能力变强训练生成器的能力，欺骗分辨器。max Dmin Gimportant tipsD训练时，固定G等D训练好了，训练G蓝色：D的分类绿色：生成器的分布黑色：rea.
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。