Deep Reinforcement Learning for Dialogue Generation

这是EMNLP2016的一片关于用reinforcement learning(RL)做dialogue generation的文章,paper链接https://arxiv.org/abs/1606.01541,一作是仍然是李纪为大神(据说是stanford CS方向第一个3年毕业的PHD),现在是香侬科技的创始人,作者homepage http://stanford.edu/~jiweil/index.html,code还没有被released出来(github上面有很多实现的版本),但是作者released很多其他的dialogue generation的code https://github.com/jiweil/Neural-Dialogue-Generation
个人瞎扯: 看这篇文章的原因。

  • 1.这篇文章是比较早利用RL来做sequence生成的文章。
  • 2.文章发表于NLP方向的顶会EMNLP2016,并且google citation很高。

文章要做的事情(dialogue generation):
输入:sentence(question)    输出:sentence(answer)
章show的可视化的实验结果如下所示。
Dialogue simulation
与state-of-the-art方法对比结果如下所示。
comparision with state-of-the-art

method

文章给出了Dialogue simulation between the two agents的示意图,如下所示。
simulation

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值