清华大学李升波教授的强化学习Tutorial Lecture

清华大学李升波教授的强化学习Tutorial Lecture

在这里插入图片描述
强化学习受生物学习行为启发,同时与最优控制和Trial and Error学习方法有着紧密联系。这份清华大学李升波教授的强化学习Lecture系统介绍了强化学习的基本概念,强化学习最优性条件、策略迭代与值迭代等基础知识。并通过介绍如何使用函数近似来表示值函数和策略,过渡到现代深度强化学习算法的讲解。最后,介绍了强化学习的一个具体落地方向:自动驾驶及课题组在这方面的系列成果,包含系统讲述强化学习的教材及强化学习开源软件GOPS。这份Lecture是开启强化学习之旅的不二选择,欢迎大家前来阅读😄!

看完这份强化学习Lecture,想要更深入更系统的学习强化学习?欢迎参考以下资料:

在这里插入图片描述
请添加图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值