![](https://img-blog.csdnimg.cn/direct/8e5d2c3fc03d4bb3a4da7516abf32b5a.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
我的强化学习笔记
文章平均质量分 89
本笔记是本人阅读《强化学习》(清华大学出版,邹伟等著)一书时 的笔记,希望以简结的方式记录本人的收获,也为那些想进入该领域的读者提供学习参考。
aganim
一个越来越沉默的人...
展开
-
22. 离线MC强化学习算法(1)
深入理解重要性采样定理,对于离线MC强化学习至关重要。本篇介绍了重要性采样定理,并推导了离线MC强化学习中如何根据采样策略获得的轨迹数据,估计待评估策略的行为值函数的数学公式。原创 2024-01-22 22:45:28 · 1272 阅读 · 0 评论 -
21.在线与离线MC强化学习
在线与离线蒙特卡洛强化学习的基本概念,进一步分类。原创 2024-01-14 14:49:50 · 1352 阅读 · 0 评论 -
20. 完整的蒙特卡洛强化学习算法
本篇给出较为完整的MC强化学习算法框架,主要采用面向对象方式描述环境和算法。这可以使我们从整体上把握MC强化学习的精髓。在这个基础上,又引出了新的问题。原创 2024-01-13 20:53:53 · 402 阅读 · 0 评论 -
19. 蒙特卡洛强化学习之策略控制
蒙特卡洛强化学习中的策略控制是什么?如何改进策略?完全贪心算法缺陷在哪里?部分贪心算法如何体现了利用与探索的基本思想?原创 2024-01-12 11:20:41 · 1113 阅读 · 0 评论 -
18 .蒙特卡洛强化学习之增量式策略评估
蒙特卡洛策略评估中行为值函数估计的增量式算法原创 2024-01-11 18:39:21 · 1025 阅读 · 0 评论 -
17.蒙特卡洛强化学习之批量式策略评估
使用批量处理,如何根据完整轨迹估计值函数,有哪两种基本方法?原创 2024-01-11 11:26:36 · 1025 阅读 · 0 评论 -
16. 蒙特卡洛强化学习基本概念与算法框架
什么是蒙特卡洛强化学习?为了理解它,需要深入理解哪些基本概念?蒙特卡洛强化学习的形式化描述。原创 2024-01-11 09:06:32 · 979 阅读 · 0 评论 -
15. 蒙特卡诺简介
简要地介绍了什么是蒙特卡诺,它有何独特之处。原创 2024-01-10 18:59:47 · 854 阅读 · 0 评论 -
14-一段插曲:强化学习扩展库-gymnasium简介
强化学习扩展库-gymnasium简介。原创 2024-01-06 00:07:35 · 1128 阅读 · 0 评论 -
13. 强化学习编程实验1-在格子世界中寻宝
本文介绍了第1个强化学习编程实验,在格子世界中寻宝的基本需求,程序设计的基本架构。原创 2024-01-06 00:02:52 · 1087 阅读 · 0 评论 -
12. 动态规划之值迭代
值迭代的动态规划法。原创 2023-12-23 12:13:51 · 175 阅读 · 0 评论 -
11. 动态规划之策略迭代
策略迭代算法原理及其流程图原创 2023-12-23 09:24:30 · 1059 阅读 · 0 评论 -
10.动态规划之策略改进
动态规划中的策略改进原理及公式。原创 2023-12-22 11:13:33 · 1020 阅读 · 0 评论 -
9.动态规划之策略评估
动态规划中的策略评估环节。原创 2023-12-22 10:21:38 · 43 阅读 · 0 评论 -
8. 动态规划简介
介绍了动态规划是什么,与马尔科夫最优决策过程的关系。原创 2023-12-22 09:32:41 · 37 阅读 · 0 评论 -
7. 最优策略
什么是最优策略,已知最优值函数或最优动作值函数,如何求最优策略的基本思路是什么?原创 2023-12-21 19:09:02 · 92 阅读 · 0 评论 -
6. 贝尔曼方程
什么是贝尔曼方程?它有哪些表达式形式?它有何意义?原创 2023-12-20 10:55:13 · 270 阅读 · 0 评论 -
5. 马尔科夫决策过程
什么是马尔科夫过程?它和强化学习有何关系?它涉及到哪些必须理解的概念?原创 2023-12-11 23:01:07 · 81 阅读 · 0 评论 -
4. 强化学习的重点概念
强化学习的重点概念:学习与规划,探索与利用,预测与控制原创 2023-12-10 22:49:40 · 93 阅读 · 0 评论 -
3. 强化学习的分类
强化学习算法分为哪些类别原创 2023-12-10 21:01:12 · 89 阅读 · 1 评论 -
2 强化学习中的智能体的组成
智能体的构成是什么?构成智能体的要素分别具有什么意义?这些要素如何定量描述?原创 2023-12-10 17:46:38 · 169 阅读 · 1 评论 -
1. 强化学习简介
什么是强化学习?它与其他机器学习方法有何不同原创 2023-12-10 20:13:28 · 123 阅读 · 1 评论