2020-06-26

强化学习7日打卡营 体验

  对于完全小白的我,7日训练我感觉还是很好的,可以当成一个RL入门,刚开始几节课有很多的基础知识,可以稍微有个基础沉淀。往后的几节课,对于我来说,理解起来不是很容易,不过好在有视频回放和代码可以看,多看几遍,一点一点的搞懂,来回翻翻代码。刚开始其实是真的看不懂,但是多看几遍发现好像也就懂点了。
    RL由**agent**   **environment**   **state**   **action**  **reward** 这几个元素组成。在我理解的是根据不同的环境训练不同的agent,主要是环境的变化会影响到最后的模型。学习中是一些人工生成的环境,看过一些别的RL的知识,里边有说过,RL的环境是要尽可能的与现实环境相似,因为环境的变化会直接影响到agent的学习,进而影响最后的模型。也有一下人会重点研究环境的构建。
    对于入门来用,我感觉很好,接触的高度高对自己也有很好的帮助,还是站的高看的远,视野是不一样的。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值