强化学习
kaitokuroba_777
Talk is cheap Show me the code
展开
-
强化学习导论(Reinforcement Learning: An Introduction)读书笔记(五):蒙特卡洛方法
强化学习导论(Reinforcement Learning: An Introduction)读书笔记五:蒙特卡洛方法1. Introduction1.1 为什么要用MC方法1.2 蒙特卡洛方法的特点2. Mote Carlo Prediction2.1 _first-vist MC_ 与 _every-visit MC_2.2 游戏21点2.3 备份图的对比3. Monte Carlo Esti...原创 2020-04-29 23:09:12 · 420 阅读 · 1 评论 -
强化学习导论(Reinforcement Learning: An Introduction)读书笔记(四):动态规划
强化学习导论(Reinforcement Learning: An Introduction)读书笔记四:动态规划写在前面1.动态规划算法的核心2. 政策价值评估2.1 两种迭代方式2.2 政策价值评估的算法2.3 举例说明写在最后写在前面由于专业学习的需要,最近开始学习强化学习的课程。目前看的书本是被誉为强化学习圣经的《Reinforcement Learning: An Introduct...原创 2020-04-23 20:24:35 · 246 阅读 · 0 评论 -
强化学习导论(Reinforcement Learning: An Introduction)读书笔记(三):有限马尔可夫决策过程
强化学习导论(Reinforcement Learning: An Introduction)读书笔记三:有限马尔可夫决策过程写在前面1.有限马尔可夫决策过程2.个体环境接口1.1 状态转移函数1.2 回报的期望值1.3 关于个体与环境的说明1.4 举例说明写在前面由于专业学习的需要,最近开始学习强化学习的课程。目前看的书本是被誉为强化学习圣经的《Reinforcement Learning:...原创 2020-03-23 14:54:25 · 551 阅读 · 0 评论