
04 贝尔曼最优公式
本文来自西湖大学赵世钰老师的B站视频。本节课介绍最优策略和贝尔曼最优公式。贝尔曼最优公式是贝尔曼公式的一个特殊情况,本次学习有两个重要概念和一个工具。(1) 两个概念:optimal state value 和optimal policy.(2) 一个工具:bellman optimality equation(BOE).强化学习的目标就是寻找最优策略,因此本文主要讲最优策略。
强化学习
机器学习
大模型
Pytorch
python编程300例
python知识点
pandas
matplotlib 
