【莫烦强化学习】视频笔记(一)3. 为什么用强化学习?

【莫烦强化学习系列视频】笔记本

第3节 为什么用强化学习?

强化学习是机器学习中的一个大的分支,随着近些年的发展,强化学习也多与深度学习相结合。总的来说,强化学习就是让你的计算机从无到有地学习,不需要任何“监督(Um……基本上就是自学,从小白到大佬的意思) 参考”来进行学习如何选择动作,如何行动才能获得给更高的回报。之前说过,强化学习具有 “分数导向性”
下面是一些强化学习的小例子,其中环境就是比如迷宫,哪里是起点,那里是墙,哪里是终点(这些都可以叫做状态),还有状态转移概率,可视化等等,动作比如东南西北、上下左右等等。计算机通过不断尝试(前期宛如智障),然后不断总结经验(更新策略),最终得到最优策略的过程。
优酷 强化学习模拟视频

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值