深度强化学习DQN
最新推荐文章于 2024-08-17 21:29:43 发布
本文介绍了深度强化学习中的DQN模型,该模型通过卷积层处理连续帧图像,得出动作的Q值。讨论了DQN算法的发展,包括NIPS 2013和Nature 2015年的研究,指出了Replay Memory导致的不足,如无法应对连续动作控制和长时记忆问题。后续研究尝试用LSTM等方法进行改进。
摘要由CSDN通过智能技术生成