DQN 从入门到放弃1 DQN与增强学习

阿拉蕾二

于 2019-04-18 10:32:22 发布

阅读量335

点赞数

本文链接：https://blog.csdn.net/qq_44906416/article/details/89373308

版权

本文是关于深度增强学习的入门介绍，重点探讨了DQN（Deep Q-Network）算法，它是将深度学习与增强学习结合的开创性工作，能够从图像输入直接输出动作。DQN在玩Atari游戏中的成功应用引发了广泛关注，成为深度学习领域的热门研究方向。文章介绍了DQN的学习之旅，强调理解DQN需要增强学习和深度学习的基础知识，并预告了接下来将深入讲解马尔科夫决策过程（MDP）。

摘要由CSDN通过智能技术生成

1 前言

深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习End-to-End Learning的一种全新的算法。简单的说，就是和人类一样，输入感知信息比如视觉，然后通过深度神经网络，直接输出动作，中间没有hand-crafted engineering的工作。深度增强学习具备使机器人实现真正完全自主的学习一种甚至多种技能的潜力。

虽然将深度学习和增强学习结合的想法在几年前就有人尝试，但真正成功的开端就是DeepMind在NIPS 2013上发表的Playing Atari with Deep Reinforcement Learning一文，在该文中第一次提出Deep Reinforcement Learning 这个名称，并且提出DQN（Deep Q-Network）算法，实现从纯图像输入完全通过学习来玩Atari游戏的成果。之后DeepMind在Nature上发表了改进版的DQN文章Human-level Control through Deep Reinforcement Learning，引起了广泛的关注，Deep Reinfocement Learning 从此成为深度学习领域的前沿研究方向。