清华大学李升波教授的强化学习Tutorial Lecture

StarMelt

已于 2025-04-18 16:38:42 修改

阅读量289

点赞数 8

文章标签：算法深度学习人工智能

于 2025-04-18 15:32:02 首次发布

本文为博主原创文章，未经博主允许禁止转载。私自转载将追究相关责任。如有问题，欢迎指正。

本文链接：https://blog.csdn.net/m0_72557046/article/details/147333132

版权

清华大学李升波教授的强化学习Tutorial Lecture

在这里插入图片描述
强化学习受生物学习行为启发，同时与最优控制和Trial and Error学习方法有着紧密联系。这份清华大学李升波教授的强化学习Lecture系统介绍了强化学习的基本概念，强化学习最优性条件、策略迭代与值迭代等基础知识。并通过介绍如何使用函数近似来表示值函数和策略，过渡到现代深度强化学习算法的讲解。最后，介绍了强化学习的一个具体落地方向：自动驾驶及课题组在这方面的系列成果，包含系统讲述强化学习的教材及强化学习开源软件GOPS。这份Lecture是开启强化学习之旅的不二选择，欢迎大家前来阅读😄！