NLP自然语言处理(十) —— 聊天机器人发展方向 & SeqGAN模型

最新推荐文章于 2023-12-28 01:16:50 发布

hxxjxw

最新推荐文章于 2023-12-28 01:16:50 发布

阅读量676

点赞数

文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hxxjxw/article/details/107746956

版权

聊天机器人模型技术发展方向

主流还是Seq2Seq + Attention

GAN对抗生成网络
DQN深度强化学习网络
GNN图神经网络

SeqGAN模型

用对抗网络生成文本

SeqGAN是对抗思想与增强学习的碰撞

由上交和UCL的人提出来的，还是本科，艹

GAN的限制

GAN的设计要求生成器的输出是一个连续空间，否则D到G(z)的梯度无法指导G修正的方向。

由于这种限制，GAN虽然在图像生成应用中获得了巨大的成功，却很少用于离散空间的文本生成

真实数据加上G的生成数据来训练D。但是我们可以知道G的离散输出，让D很难回传一个梯度用来更新G，因此需要做一些改变，看上图（右），paper中将policy network当做G，已经存在的红色圆点称为现在的状态（state），要生成的下一个红色圆点称作动作（action），因为D需要对一个完整的序列评分，所以就是用MCTS（蒙特卡洛树搜索）将每一个动作的各种可能性补全，D对这些完整的序列产生reward，回传给G，通过增强学习更新G。这样就是用Reinforcement learning的方式，训练出一个可以产生下一个最优的action的生成网络。

实战 https://github.com/skyerhxx/SeqGAN

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。