NOTE:Deep Reinforcement Learning with a Natural Language Action Space

162 篇文章 114 订阅 ¥9.90 ¥99.00
本文探讨了深度强化学习(DRL)在自然语言处理中的应用,特别是在文字游戏任务中的实验。研究中,作者提出了一种改进的DQN网络结构,通过分开学习状态和动作的向量表示,解决了大词表问题,提高了模型效果。实验结果显示,这种方法在与Max-action DQN和Per-action DQN的比较中表现优越。
摘要由CSDN通过智能技术生成

论文链接:Deep Reinforcement Learning with a Natural Language Action Space

标题:Deep Reinforcement Learning with a Natural Language Action Space

来源:ACL 2016

问题

实验任务:文字游戏,实验目标—-提出一种效果更好的DQN网络结构
(1)本文属于探索深度增强学习在nlp领域的应用,实验任务采用了nlp中较方便建立马尔可夫过程的文字游戏任务。文字游戏任务本质还是游戏,只是将当前游戏的环境和现状用文字描述出来,然后玩家根据阅读后的理解输入相应文字来作为操作方案。例如游戏显示“当前有两条岔路,请问选择左还是右?”,那么玩家则相应输入“左”或者“右”来作为操作。
(2)作者认为传统的DQN网络在解决上述问题时实验结果尚存不足,因而提出一种分开学习state和action向量表示的网络结构,并进行相应实验

主要方法

本文采用的方法本质是深度增强学习,下面简单介绍一下

深度增强学习即增强学习在深度学习上基础的实现,本质是用深度神经

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值