强化学习
文章平均质量分 93
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
alwaysuzybai
"Serena, you're the most beautiful, amazing, alive person I've ever know."
展开
-
七天强化学习DAY1-2|(二)马尔科夫决策过程MDP|学习笔记
这一篇主要就是讲如何利用马尔科夫决策过程(Markov Decision Process)简化强化学习模型;MDP这一篇对应Sutton书的第三章和UCL强化学习课程的第二讲。原创 2022-11-14 20:24:11 · 366 阅读 · 0 评论 -
七天强化学习DAY1-1|(一)模型基础
局部reward和全局reward之间的关系每一步奖励值求和从今天开始学习强化学习领域的知识,主要参考的资料是Sutton强化学习书和UCL强化学习的课程。第一篇会从强化学习的基本概念讲起,对应Sutton书的第一章和UCL课程的第一讲。转载 2022-11-05 23:43:57 · 488 阅读 · 0 评论