DQN的理论研究回顾
1. DQN简介
强化学习(RL)(Reinforcement learning: An introduction, 2nd, Reinforcement Learning and Optimal Control)一直是机器学习的一个重要领域,近几十年来获得了大量关注。RL 关注的是通过与环境的交互进行连续决策,从而根据当前环境制定指导行动的策略,目标是实现长期回报最大化。
Q-learning 是 RL 中最重要的学习策略之一,自它被 Watkins 1992 提出以来,就一直受到了深入的研究。 详情请参见: