简介
今天我们带来本系列第六篇文章:北美CS名校强化学习与决策控制相关课程的整理。本系列今后将持续保持一周两更的频率,想学习更多请点击关注专栏大学模拟器,点赞支持,也欢迎关注微信公众号Univ模拟器。
强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。(摘自《机器之心》)
课程资料
由于本人平时需要上班,现在的文章将主要列出课号、名称与主页链接。其他资源链接将在有精力的时候补上。非常欢迎志同道合的有为青年加入我们(私信我),帮忙收集资料或者发一些与课程相关的学习心得体会。
加州大学伯克利分校 UCB
CS 285: Deep Reinforcement Learning, Decision Making, and Control
CS281B: Advanced Topics in Learning and Decision Making
斯坦福大学 Stanford
CS234: Reinforcement Learning
CS239 Sequential Decision Making
AA228/CS238 Decision Making under Uncertainty
卡耐基梅隆大学 CMU
16-881: Special Topics: Deep Reinforcement Learning for Robotics
16-745: Optimal Control and Reinforcement Learning
10-403: Deep Reinforcement Learning and Control
Econ 3810/Econ 6760/ CS 5846: Decision Theory
ORIE 5751: Learning and Decision Making From Data
伊利诺伊大学香槟分校 UIUC
CS 598: Statistical Reinforcement Learning (S19)
华盛顿大学 UW
CSE 479: Intelligent control through learning and optimization
大学模拟器专栏旨在为广大学习爱好者收集公开/非公开资源,降低在校学生与工作人士的学习成本,提供免费可得的课程培养方案。最终达到降低内卷、打击智商税收割者的目的。
从今天开始,本专栏在之后几个月将陆续发出关于北美名校CS专业的相关课程主页链接,课程主题全面覆盖人工智能(自然语言处理、计算机视觉、增强学习)、机器学习理论与应用、数据结构与算法分析、大数据与并行计算、操作系统与编译原理、网络与信息安全、分布式系统与数据库、机器人、数值分析与计算机基础数学、人机交互、机器人、计算机图形学等方面的内容,目前主要面向Stanford、MIT、UCB、CMU、UIUC、Cornell、Princeton、Caltech、Harvard、UW、Georgia Tech、UT Austin这几所CS强校。