GAN学习(1)

https://mp.weixin.qq.com/s/ZIJAdOGgdrOKCdXkEBDyMA
GAN综述介绍阅读笔记
GAN的原理

GAN在序列生成上的问题:

相比于 GAN 在图像领域的应用,GAN 在文本,语音领域的应用要少很多。主要原因有两个: 
1. GAN 在优化的时候使用 BP 算法,对于文本,语音这种离散数据,GAN 没法直接跳到目标值,只能根据梯度一步步靠近。 
2. 对于序列生成问题,每生成一个单词,我们就需要判断这个序列是否合理,可是 GAN 里面的判别器是没法做到的。除非我们针对每一个 step 都设置一个判别器,这显然不合理。 
为了解决上述问题,强化学习中的策略梯度下降(Policy gredient descent)被引入到 GAN 中的序列生成问题

GAN的目标函数在dialogue是什么样子?
GAN和强化学习有相似的地方,无法直接客观的判断生成样本的好坏
GAN训练有一定难度(优化目标函数来解决、zhujunyan文章对于GAN训练提出技巧)

任务:
复现lijiwei文章;
阅读liubing和peng文章,精读,基本上对模型的每一步都要了解,包括输入输出,公式推导,
再找新文章阅读

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值