
强化学习
文章平均质量分 66
bijingrui
bijingrui1997
展开
-
不同gym游戏 reward的设置探究
带滑梯的走迷宫CliffWalkingaction后的探究进入黑色滑梯,reward = -100,人物回到原点,done = False。走一步,安全情况下,reward = -1走到终点,reward = -1,done = True想想这个table里面数值是什么样的滑梯...原创 2021-08-04 22:52:59 · 1939 阅读 · 0 评论 -
value-based RL:DQN
DQN简介原创 2021-08-03 23:40:32 · 365 阅读 · 1 评论 -
基于表格的RL:Q-learning、sarsa
基于表格的强化学习原创 2021-08-02 19:45:10 · 202 阅读 · 0 评论 -
强化学习概述
强化学习简单介绍原创 2021-08-02 17:30:37 · 177 阅读 · 0 评论 -
深度强化学习_ShusenWang_笔记
https://www.bilibili.com/video/BV1rv41167yx 作者是ShusenWangup主(no瞎哔哔)学习笔记https://mp.weixin.qq.com/s/VDSQClM4liO3JzbB48NU9w原创 2021-03-03 15:04:33 · 511 阅读 · 1 评论 -
【别人写的图解】强化学习:q-learning算法
参考:https://www.cnblogs.com/dragonir/p/6224313.html前述:训练的越多,Q矩阵被优化得越好!例子:第一次episode:想象中:当agent处于状态5,只能去(5,1) (5,4) (5,5)Q矩阵更新为:第二次episode:3能去 (3,1) (3,2) (3,4) 随机地,我们选择(3,1)想象中:agent处于1状态,能去(1,3) (...原创 2020-10-11 16:59:19 · 587 阅读 · 0 评论