百度飞桨世界冠军带你从零实践强化学习总结

强化学习个人感悟

强化学习就像是人类几代人不断的探索获得一个比较好的结果的过程,类似于适者生存的过程,但是就是通过机器的学习与算法在模拟这个过程,尽可能获得一个比较好的收益(对于机器来说)(对于我们来说是获得一个较准确的结果),通过算法模拟获得一个比较好的结果。

当然除了算法还有神经网络和Q表格之类的,可以把可能出现的非连续的或连续的情况进行模拟。通过数字等模拟建模生成一个对象进行反映,反映出来的数据就是我们的训练结果,结果好就是传说中的人工智能,不好那就是传说中的人工智障。

学习思路

首先是Python基础,numpy库、pandas库、matplotlib库等基础数据处理分析库 的掌握情况。
然后是一些数学的基础知识,有些时候不一定懂但是一定要回用,还有基础统计学知识。
接着是深度学习的和强化学习的理论课程,然后就是运用已有模型进行练习和学习。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值