斯坦福2019强化学习课程完结，讲义、PPT、视频已提供下载

最新推荐文章于 2024-09-01 07:00:00 发布

量子位

最新推荐文章于 2024-09-01 07:00:00 发布

阅读量1.8k

点赞数 1

晓查发自凹非寺
量子位出品 | 公众号 QbitAI

斯坦福大学AI课程资源接二连三开始更新。上周NLP课程才结束，这周强化学习（RL）课程也已全部完结。

现在，强化学习课程讲义、PPT可以在官网下载，第一部分的课程已上传至YouTube。

本课程主讲人是斯坦福大学的助理教授Emma Brunskill。她2009年从MIT博士毕业，现在是斯坦福统计机器小组成员，2012年曾入选微软研究院Fellow。

Emma教授的主要研究方向是高风险场景下的强化学习：当获取经验的成本和风险很高时，智能体如何从经验中学习并做出正确的决策。实际应用包括教育软件、医疗决策、机器人等。

640?wx_fmt=png

课程内容

斯坦福大学今年的RL课程从1月7日开始，每周2节课，共持续10周，到今年3月13日结课。

课程内容主要有：强化学习入门、学习评估策略、函数近似、大空间中的模仿学习、策略搜索、元学习、批量强化学习等等。

640?wx_fmt=png

Emma教授给学生制定了这些目标：

定义强化学习的关键特征，并将其与非交互式的机器学习区别开来；
确定是否能将实际问题公式化为RL问题，如何定义这类问题，说明哪种算法最适合解决它；
常见RL算法的代码实现；
描述用于分析评估RL算法的标准；
描述探索与开发的挑战，并对比至少两种解决这一挑战的方法。

学完本课程后，你可以用这套标准来衡量自己的学习成果。

所需基础知识

本课程不是面向零基础人士，需要掌握以下知识：

Python：本课程使用numpy、TensorFlow以及Keras
大学微积分和线性代数：理解矩阵向量的运算和符号
概率与统计学：了解概率、高斯分布、期望值、标准差等基础知识
机器学习基础：本课程将定义损失函数，并通过梯度下降算法进行优化

课程资料汇总

最后附上课程全部资源：

课程主页：
http://web.stanford.edu/class/cs234/index.html

《强化学习入门》第二版：
http://incompleteideas.net/book/the-book-2nd.html

PPT下载地址：
http://web.stanford.edu/class/cs234/schedule.html

视频地址：
https://www.youtube.com/playlist?list=PLoROMvodv4rOSOPzutgyCTapiGlY2Nd8u

— 完 —

量子位AI+系列沙龙--智慧城市

640?wx_fmt=png

加入社群

量子位AI社群开始招募啦，量子位社群分：AI讨论群、AI+行业群、AI技术群；

欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“微信群”，获取入群方式。（技术群与AI+行业群需经过审核，审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

640?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点这里吧 !

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。