7天强化学习营学习笔记

基础知识

只是大概的内容,包括5大部分:
1.机器学习基础知识(神经网络等)
2.数学基础知识(概率论与梳理统计,高数,线性代数等)
3.Python基础(numpy)
4.PaddlePaddle入门
5.使用环境基础知识(此处为AIstudio的Notebook)

Lesson1学习笔记–RL初印象

RL, reinforcement learning, 强化学习,是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。

相关概念

1.核心思想:智能体(agent)在环境(environment)中学习,根据环境的状态state(或观测到的observation),执行动作action,并根据环境的反馈 reward(奖励)来指导更好的动作。
2.state V.S. observation
从环境中获取的状态,有时候叫state,有时候叫observation,这两个其实一个代表全局状态,一个代表局部观测值,在多智能体环境里会有差别,但我们刚开始学习遇到的环境还没有那么复杂,可以先把这两个概念划上等号。
pic

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值