强化学习——从Q-Learning到DQN
1 学习目标复习Q-Learning;理解什么是值函数近似(Function Approximation);理解什么是DQN,弄清它和Q-Learning的区别是什么。2 用Q-Learning解决经典迷宫问题现有一个5房间的房子,如图1所示,房间与房间之间通过门连接,编号0到4,5号是房子外边,即我们的终点。我们将agent随机放在任一房间内,每打开一个房门返回一个reward。图2为房间之间的抽象关系图,箭头表示agent可以从该房间转移到与之相连的房间,箭头上的数字代表rew
转载
2020-11-27 00:06:54 ·
984 阅读 ·
0 评论