撒花!港中文周博磊--强化学习课程完结(附课件下载!)

【导读】 从三月中旬开始到现在,历时整整两个多月时间,每周录制和剪辑一课视频,周末至少投入大半天时间,周博磊大牛终于独自一人把这门《强化学习纲要》整理完成。这可能也是全网第一个中文强化学习课程。超级赞,感谢大牛的课程分享,下面视频齐刷刷放一起,还没看的各位RLer们,快去看起来!(文末附视频链接和课件打包下载!)

image

image

个人简介

周博磊: 2010年本科毕业于上海交通大学,2012年硕士毕业于香港中文大学,2018年博士毕业于麻省理工学院,现任香港中文大学信息工程系助理教授。

研究方向主要为机器感知和决策,重点是通过学习可解释、结构化的表征,使机器能够在复杂的环境中感知、推理和行动。

获奖荣誉:

  1. MIT Technology Review 2020年亚太地区35岁以下的创新者

  2. Facebook PyRobot:Democratizing Robotics Research Award2019

  3. Facebook博士2016-2018年计算机视觉研究金

  4. 2017年BRC奖学金

  5. 麻省理工学院Ho-Ching and Han-Ching Fund Award 2013

  6. 麻省理工学院大中华计算机科学奖学金2013

  7. 香港中文大学2012年度杰出论文奖

  8. 2011年微软亚洲研究金

  9. 香港中文大学研究生奖学金2010-2012

  10. 上海交通大学2010年度优秀本科生论文

更多信息,详见个人主页:http://bzhou.ie.cuhk.edu.hk/

强化学习课程目录
  1. 概括与基础

  2. 马尔科夫决策过程

  3. 无模型的价值函数估计和控制

  4. 价值函数的近似

  5. 策略优化基础

  6. 策略优化进阶

  7. 基于环境模型的 RL 方法

  8. 模仿学习

  9. RL 分布式系统

  10. 完结篇

image

部分课件pdf展示

image

image

image

image

传送门下载

为了方便大家学习,我已将所有课程PPT打包下载好!请关注深度学习技术前沿公众号

  • 后台回复“RL2020” 就可以获取**《港中文周博磊强化学习纲要》视频链接和课程PPT资料**
重磅!DLer-强化学习交流群已成立!

欢迎各位RLer加入强化学习微信交流大群,本群旨在交流强化学习框架、策略梯度、DQN、理论推导与算法实现、前沿技术与顶会文章解读、应用场景等内容。更有求职内推、算法竞赛、资源干货、业界前沿资讯等,欢迎加群交流学习!

进群请备注:研究方向+学校/公司+昵称(如强化学习+上交+王明)

image

👆 长按识别,即可邀请您进群!
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值