论文名称叫:Improved Q-Learning Applied to Dynamic
Obstacle Avoidance and Path Planning
论文比较简单,就是在Q-learning上做了一点改动。仿真环境为网格环境。
作者就是把DQN中的经验池添加进Q-learning中,只有这一处改动。另外,文中说的动态障碍物并没有体现出来,只不过换了一个网格环境而已。
代码上传到了github中:GitHub链接
论文名称叫:Improved Q-Learning Applied to Dynamic
Obstacle Avoidance and Path Planning
论文比较简单,就是在Q-learning上做了一点改动。仿真环境为网格环境。
作者就是把DQN中的经验池添加进Q-learning中,只有这一处改动。另外,文中说的动态障碍物并没有体现出来,只不过换了一个网格环境而已。
代码上传到了github中:GitHub链接