关于李宏毅GAN课程的一些笔记

本文探讨了GAN的工作原理,包括为何需要生成器和判别器配合、条件GAN如何利用文本描述引导生成、数学理论中的JS散度和优化策略,以及为何目标是寻找分布一致而非其他。

这里只记录一些看完1-4课后,被解决的困惑们。
一、为什么使用GAN
GAN有生成器G和判别器D。
能不能只用生成器?
可以,但是需要的网络更大更深。
能不能只用判别器?
可以,但最终生成的结果可能会很模糊。
在这里插入图片描述

二、条件GAN
比如有一些文本描述,辅助生成图像。
三、数学理论
需要注意的一些小细节。

  1. G就是为了让生成数据的分布和真实数据分布是一致的,例如真实数据是一些图像,世界上所有的图像组成一个高维的空间,真实的图像只占其中一部分,我们假设它们是满足某个分布PdataP_{data}Pdata的,所以我们希望生成的数据也服从这个分布(同mean,同var)。
    转化为优化问题,其实G是为了最小化一个真实数据分布和生成数据的分布之间的度量。
    后来经过证明maxDV(G,D)max_D V(G,D)maxDV(G,D)可以看作JS散度,去度量上述两个分布。
    所以,G∗=arg min⁡Gmax⁡DV(G,D)G^*=\argmin_G \max_D V(G,D)G

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值