一图看懂DQN(Deep Q-Network)深度强化学习算法
DQN简介
DQN是一种深度学习和强化学习结合的算法,提出的动机是传统的强化学习算法Q-learning中的Q_table存储空间有限,而现实世界甚至是虚拟世界中的状态是接近无限多的(比如围棋),因此,无法构建可以存储超大状态空间的Q_table。不过,在机器学习中, 有一种方法对这种事情很在行,那就是神经网络,可以将状态和动作当成神经网络的输入,然后经过神经网络分析后得到动作的 Q 值,这样就没必要在表格中记录 Q 值,而是直接使用神经网络预测Q 值 [1]。
算法框架
下面是DQN算法框架,如果想更详细地理解DQN,请点击这里,参阅源文章《Playing Atari with Deep Reinforcement Learning》。
算法图解
根据文献阅读,学习教程[1](可点击这里),和项目实践[2](可点击