强化学习-part1

第一章 概括与基础

datawhale组对学习part1

学习方式:通过观看b站up主博磊的强化学习视频,完成习题

视频:
概括与基础 上:https://www.bilibili.com/video/BV1LE411G7Xj
概括与基础 下:https://www.bilibili.com/video/BV1g7411Z7SJ

强化学习概念:agent在一个环境中 极大化获得奖励

强化学习的困难: (对比监督学习)
1.样本并不是互相独立的
2.不能立刻得到反馈,没有标签说明是否每一步骤是对错,只有当游戏结束才会有结果
3.通过不断试错获得提升
4.告诉你行为错误,但并未告诉正确行为是什么,而且可能是一段时间后才有反馈

强化学习的特点
1.需要在环境里学习,获得对环境的经验

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值