强化学习
文章平均质量分 92
小齿轮|
今天有在进步么?
展开
-
强化学习学习笔记(3)---贝尔曼最优公式
点 x 属于集合 X,f 是一个映射(或者叫函数),如果满足 f(x) = x,则 x 就被称为一个不动点。f 是收缩映射(contraction mapping),如果满足:(伽马可以自由选择的,只要在0到1之间)对于任何形式为 x = f(x) 的方程,如果 f 是收缩映射,那么满足存在性:存在一个满足 f(x*) = x* 的不动点(fixed point) x*。原创 2024-05-14 15:56:19 · 1116 阅读 · 0 评论 -
强化学习学习笔记(2)---贝尔曼公式 Bellman Equation
策略评估中的贝尔曼公式原创 2024-05-11 22:43:53 · 1252 阅读 · 0 评论 -
强化学习学习笔记(1)---强化学习的基本概念
强化学习各个参数的应用及条件概率原创 2024-05-10 18:01:34 · 850 阅读 · 0 评论