![](https://img-blog.csdnimg.cn/20190927151124774.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
强化学习-模型
文章平均质量分 92
强化学习-模型
nopSled
一周一更
展开
-
Text-based RL Agents with Commonsense Knowledge: New Challenges, Environments and Baselines翻译
多年来,仿真环境已被广泛用于推动强化学习的进步(RL)。一个最近引起很多关注的框架被称为TextWorld (TW),其中agent必须与外部环境进行交互,并仅使用文本来完成给定的目标。TextWorld和类似的基于文本的环境试图将基本语言理解的优势带入序列决策中。尽管现有的基于文本的游戏对于RL的研究很有价值,但它们无法测试人类智能的关键方面:常识。人类在与世界互动的同时,会利用有关实体的常识(背景)知识,例如属性,空间关系,事件,因果和影响以及其他社交传统。...翻译 2022-08-15 13:12:39 · 206 阅读 · 0 评论 -
Dota 2 with Large Scale Deep Reinforcement Learning翻译
摘要翻译 2021-12-06 14:36:45 · 866 阅读 · 0 评论 -
Deep Recurrent Q-Learning for Partially Observable MDPs翻译
摘要深度强化学习已经为复杂任务提供了精准的控制器。但是,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏画面。为了解决这些缺点,本文研究了用循环LSTM替换卷积后的第一个全连接层,从而在深度Q网络(DQN)中增加重复性的影响。最终的深度循环Q网络(DRQN)虽然在每个时刻只能看到一个帧,但可以成功地整合时间信息,并在标准Atari游戏和具有闪烁游戏画面的部分可观察到的等效游戏中复制...翻译 2020-03-08 14:24:15 · 454 阅读 · 0 评论 -
(DQN)Human-level control through deep reinforcement learning翻译
1.摘要强化学习的理论提供了一种规范的解释,这种解释深深植根于关于动物行为的心理学和神经科学观点中,关于agent如何优化环境控制的。但是,要在逼近现实世界的情况下成功使用强化学习,agent面临着一项艰巨的任务:他们必须从高维感官输入中获得对环境的有效表示,并使用它们将过去的经验推广到新的情况中。值得注意的是,人类和其他动物似乎通过强化学习和分层感官处理系统的和谐组合解决了这一问题,前者由大量...翻译 2020-02-24 15:21:04 · 751 阅读 · 0 评论