强化学习ppt_李宏毅强化学习完整笔记!开源项目LeeDeepRLNotes发布

《LeeDeepRL-Notes》是Datawhale团队根据李宏毅老师强化学习课程整理的完整笔记,涵盖课程内容、习题、项目,旨在帮助学习者更好地理解和掌握强化学习。笔记100%复现课程,包含补充资料和习题,配合视频使用效果更佳,同时提供项目实践和Tensorboard可视化。项目已在GitHub开源。
摘要由CSDN通过智能技术生成
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习 ,不错过  Datawhale开源  核心贡献者:王琦、杨毅远、江季

提起李宏毅老师,熟悉强化学习的读者朋友一定不会陌生。很多人选择的强化学习入门学习材料都是李宏毅老师的台大公开课视频。

现在,强化学习爱好者有更完善的学习资料了! Datawhale开源项目组成员总结了李宏毅的强化学习视频,实现了视频教程的完整梳理和复现,再也不用担心强化学习

目前,项目已完全开源,包括课程内容、配套的习题和项目,供大家使用。

c3be4006c241e05caa13b965972b20b4.png

1. 李宏毅深度强化学习简介

李宏毅老师现任台湾大学电气工程系副教授,主要研究方向是机器学习,特别是深度学习。他有一系列公开的强化学习课程视频,也是很多人入门的教程。

ce247b84019c38efb92de21649f8cdaa.png

李宏毅老师的课程包括很多常见的强化学习算法,比如策略梯度、PPO、DQN、DDPG、演员-评论员算法、模仿学习、稀疏奖励等算法。此外,我们还补充了马尔可夫决策过程、Q-learning、Sarsa、REINFORCE 等强化学习常见的算法及概念。

a9b39535fcc31c96b5c11f33b47b4730.png
「策略梯度」课程中的 PPT,解释了策略梯度的过程
11bf79bd11219ed706b8676ebbd6e0b8.png
「近端策略优化算法」课程中的 PPT,展示了重要性采样的问题

李宏毅老师的《深度强化学习》是强化学习领域经典的中文教程之一。李老

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值