强化学习
玛卡巴卡_qin
这个作者很懒,什么都没留下…
展开
-
【王树森】深度强化学习(DRL)课程笔记:P2 价值学习
试图找出能预测最优action的Q*函数。原创 2023-08-09 16:02:04 · 340 阅读 · 0 评论 -
【王树森】深度强化学习(DRL)课程笔记:P1 基本概念(含gym安装)
课程主讲:王树森(史蒂文斯理工学院计算机科学系的终身制助理教授)课程内容:基本概念、价值学习、策略学习、Actor-Critic方法、AlphaGo、Monte Carlo (蒙特卡洛)课程资料:https://github.com/wangshusen/DRL下载链接:https://pan.baidu.com/s/1XpTgny_Vr0LobBsuYF4KkA 密码:x0wbB站搬运地址:https://www.bilibili.com/video/BV12o4y197US概率密度函数(Probab原创 2023-08-08 20:52:27 · 412 阅读 · 0 评论