7天飞桨深度学习学院--强化学习笔记1
基础知识
只是大概的内容,包括5大部分:
1.机器学习基础知识(神经网络等)
2.数学基础知识(概率论与梳理统计,高数,线性代数等)
3.Python基础(numpy)
4.PaddlePaddle入门
5.使用环境基础知识(此处为AIstudio的Notebook)
Lesson1学习笔记–RL初印象
RL, reinforcement learning, 强化学习,是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。
相关概念
1.核心思想:智能体(agent)在环境(environment)中学习,根据环境的状态state(或观测到的observation),执行动作action,并根据环境的反馈 reward(奖励)来指导更好的动作。
2.state V.S. observation
从环境中获取的状态,有时候叫state,有时候叫observation,这两个其实一个代表全局状态,一个代表局部观测值,在多智能体环境里会有差别,但我们刚开始学习遇到的环境还没有那么复杂,可以先把这两个概念划上等号。