论文阅读—《一种基于视觉注意力机制的深度循环Q网络模型》
1、论文摘要
论文中使用带视觉注意力机制的循环神经网络改进 了传统的dqn,新模型的关键思想有两点:
使用双层门限循环单元构成的循环神经网络模块来记忆较长时间步内的历史信息。这使得agent能够及时使用有延迟的反馈 奖赏来正确地指导下一步的动作选择;
通过视觉注意力机制自适应地将注意力集中于面积较小但更具价值的图像区域,从而使得agent能够更加高效地学习近似最优策略。
...
原创
2019-09-16 16:04:36 ·
600 阅读 ·
0 评论