强化学习总结01 基本概念
1. 概述
强化学习是智能体(Agent)与环境(Environment)不断交互, 不断提高自己的决策能力的过程.
面向智能体的学习——通过与环境进行交互
所学习的「样本」来自于「与环境的交互」。而非像传统机器学习的样本是现有的。
通过「试错和优化」进行学习——用试错后的奖励(或惩罚) 来学习
「总体过程」:环境(Environment)会给智能体(Agent)一个观测值(Observation)(全观测时,状态 state 和 observation 等价), 智
原创
2020-06-12 10:44:48 ·
894 阅读 ·
0 评论