第一章 概括与基础
datawhale组对学习part1
学习方式:通过观看b站up主博磊的强化学习视频,完成习题
视频:
概括与基础 上:https://www.bilibili.com/video/BV1LE411G7Xj
概括与基础 下:https://www.bilibili.com/video/BV1g7411Z7SJ
强化学习概念:agent在一个环境中 极大化获得奖励
强化学习的困难: (对比监督学习)
1.样本并不是互相独立的
2.不能立刻得到反馈,没有标签说明是否每一步骤是对错,只有当游戏结束才会有结果
3.通过不断试错获得提升
4.告诉你行为错误,但并未告诉正确行为是什么,而且可能是一段时间后才有反馈
强化学习的特点:
1.需要在环境里学习,获得对环境的经验