强化学习入门 task1 概括与基础
主要根据周博磊教授的教学视频进行学习整理,由于和方向关系不大且最近忙着学习别的orz,随时准备跑路
- 视频地址https://www.bilibili.com/video/BV1LE411G7Xj
- 课程资料
https://github.com/zhoubolei/introRL - 课件
https://github.com/zhoubolei/introRL/blob/master/lecture1.pdf
作者介绍
课程目录
推荐书目
实验火箭Python、PyTorch
1. 1 什么是强化学习
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题
通俗来讲就是使一个agent在一个复杂环境中去极大化获得奖励