直观理解GAN公式含义,直击灵魂

理解GAN的基本思想

1.GAN是干什么的

GAN于2014年Goodfellow提出,提出的出发点&创新点是:

①我们能不能通过深度学习生成图片?

我们通过Generative Adversarial Network [对抗生成网络]生成图片。GAN的类型 是一种“方法论”而不是网络结构 ,既可以用于与NN结合,也可以与CNN结合。

②如何解决?

生成器:Generatior

决策器:Discriminator

理解这两个结构有助于后面的公式推导,也就是说:

  • G负责从某种分布的噪音中生成一幅图片,做为fake image,生成的越“真”越好。

  • D负责监测/评价G生成的fake image,判断生成样本Real or Fake。
    在这里插入图片描述

2.理解GAN的价值函数
2.1如何直观理解公式

min ⁡ G max ⁡ D V ( D , G ) = E x − P d a t a ( x ) [ l o g D ( x ) ] + E z − p z ( z ) [ l o g ( 1 − D ( G ( z ) ) ) ] \min_{G}\max_{D}V(D,G) = E_{x-P_{data}(x)}[logD(x)] +E_{z-p_{z}(z)}[log(1-D(G(z)))] GminDmaxV(D,G)=ExPdata(x)[logD(x)]+Ezpz(z)[log(1D(G(z)))]

  • 首先为什么不用传统机器学习的Loss function而使用V(D, G)?

Value Function【价值函数】这个概念来自于强化学习(Reinforcement Learning),这里不多说,简而言之它的意思是:在状态t下通过观测自己的状态而做出一个决策,这个决策使得t+1时刻进入新的状态,而这种转移带来的收益记作Reward(R1, R2, R3…Rt)。状态结束时我们希望Value Function收益最大。

  • 理解价值函数Value Function

这里说一个形象的小故事。

小天家祖传三代鉴赏师,从小家里就培养他接触家族事业——成为最伟大的Discriminator。从他还不会说话的时候就让他学习鉴赏,大量浏览赝品于真迹,未来的生活里,他鉴别成功的次数越多,他赚的钱就越多,Reward越多。这是小天家的理念。

小华家祖传三代仿制大师,一生坑人无数,从小家里就培养他接触家族手艺,成为伟大的——Generator。从还不会走路就开始学习制作仿品,未来的生活中,制作的仿品一旦被发现就要坐牢甚至被追杀,富贵险中求,越少被拆穿,Reward越多,这是小华家的理念。

**GAN就是为了生成以假乱真的样品,如果我们顶级的Discriminator都鉴别不出Generator生成的Fake Image,那么才算成功的GAN。**所以这里用Value Function 表示目的是为了获取最大收益就可以形象的理解了

2.2分析GAN公式细节——max部分

补充:公式中的 x 表是真品; z 表示噪声;D(x)表示真品概率;G(z)表示通过噪声生成的赝品&#x

  • 4
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值