SeqGAN论文翻译与原理理解 =>SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

最新推荐文章于 2022-09-01 20:51:31 发布

love_image_xie

最新推荐文章于 2022-09-01 20:51:31 发布

阅读量2.4k

点赞数

分类专栏： Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love_image_xie/article/details/85160314

版权

摘要：GAN采用判别模型引导生成模型的训练在连续型数据上已经产生了很好的效果，但是有两个limitations，第一，当目标是离散数据时，如文本，不可能文本+1产生梯度信息引导生成器的生成；第二，判别模型只能对完整的序列产生判别信息，对于非完整序列，它并不知道当前的判别结果和未来完整序列的判别结果是否相同。SeqGAN可以解决这两个问题。采用强化学习的reward思想，实行梯度策略更新解决生成器的微分问题，即解决了第一个问题，采用Monte Carlo search将不完整的序列补充完整解决第二个问题。

SeqGAN：

给定真实序列数据集，训练 $G_{\theta }$ 产生序列 $Y_{1:T}=(y_{1},...,y_{t},...,y_{T})$ ， $y_{t}\in \upsilon$ , $\upsilon$ 是词汇表。在第步，状态是当前生成的序列 $(y_{1},...,y_{t-1})$ , 行为是下一个选择的token $_{}$ $y_{t}$ ，因此策略模型

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
SeqGAN论文翻译与原理理解 =>SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

摘要：GAN采用判别模型引导生成模型的训练在连续型数据上已经产生了很好的效果，但是有两个limitations，第一，当目标是离散数据时，如文本，不可能文本+1产生梯度信息引导生成器的生成；第二，判别模型只能对完整的序列产生判别信息，对于非完整序列，它并不知道当前的判别结果和未来完整序列的判别结果是否相同。SeqGAN可以解决这两个问题。采用强化学习的reward思想，实行梯度策略更...
复制链接

扫一扫

专栏目录

love_image_xie CSDN认证博客专家 CSDN认证企业博客

码龄7年

49: 原创

106万+: 周排名

153万+: 总排名

8万+: 访问

: 等级

1304: 积分

10: 粉丝

35: 获赞

12: 评论

229: 收藏

私信

关注

热门文章

分类专栏

最新评论

SeqGAN代码解析
IsAYN. . .: 同问，请问解决了吗？
SeqGAN代码解析
liudinglldd: self.pretrain_loss计算的是什么误差？如果用自己的数据文件替换target_lstm生成数据，那么这个pretrain_loss应该怎么改啊？现在只知道，计算pretrain_loss有两个量参加，一个是generator产生的eval_file通过likelihood_data_loader得到的batch，传递给self.x，参与计算的另一个量，self.g_prediction的计算过程如何用自己的数据文件来参与运算呢？
SeqGAN代码解析
liudinglldd: 试了，不对。替换文件之后，里面的值是一样的，多次运行发现里面的值始终是固定的，而且即使修改sequence length，维数也不会变化
SeqGAN代码解析
liudinglldd: 是不是把那个positive file替换成自己的文件就行了，同时修改那个sequence length？
opencv中Mat、Size、Point等出现的行列对应问题
递归黑: 我吐了，这那个nc设计的啊？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。