今晚直播 |深度强化学习的关键点在哪? 世界冠军的干货分享千万不能错过


都说强化学习很难,其实掌握了正确的学习方法,也会变得非常简单!

这次,所以我们荣幸的邀请到了百度连续两届获得NeurIPS全球顶会赛事冠军团队,6月16日-6月23日,连续7天,20:30-21:30,以直播的形式,手把手带大家从零实践强化学习!

昨天的课程,科科老师从理论到代码,详细讲解了强化学习核心算法DQN,听了课的小伙伴表示,短短一小时,就把之前看了好几遍都没看懂的原理全弄明白了,科老师的课简直太值得了。

今晚精彩更多

依然是北大最美学霸科科老师,会从策略梯度方法的角度出发,通过类比监督学习、深入讲解代码的方式,带你轻松玩转强化学习。

基于策略梯度方法求解RL

1. 策略近似

2. 详解Policy Gradient算法

3. PARL Policy Gradient代码解析

强化学习研究领域的不同派别,同一个CartPole小游戏还能玩出不一样的花样?重点抢先看:

直播时间

6月19日(今晚)20:30 - 21:30

讲师介绍

百度高级研发工程师 科科老师

飞桨强化学习PARL团队核心成员,所在团队曾两度夺得NeurIPS强化学习赛事世界冠军,并获得百度最高奖等荣誉。

快来和世界冠军大佬面对面交流吧~

点击“阅读原文”加入课程,获取更多课程资料哦!

展开阅读全文
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值