《强化学习:原理与Python实现》笔记——第一章
第1章 初识强化学习
强化学习(Reinforcement Learning)来源于行为心理学,表示生物为了趋利避害而更频繁实施对自己有利的策略。
1.1 强化学习及其关键元素
在人工智能领域中,强化学习是一类特定的机器学习问题。
在一个强化系统中,决策者可以观察环境,并根据观测作出行动。在行动之后,能够获得奖励。
强化学习通过与环境的交互来学习如何最大化奖励。
强化学习系统的两个关键要素:
奖励:强化学习系统的目标,包括正奖励和负奖励。
策略:强化学习的学习对象就是策略。决策者根据不同的观测采用不同的动
原创
2020-11-22 00:35:25 ·
1237 阅读 ·
1 评论