强化学习深入浅出完全教程—1972人已学习
课程介绍
深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。 强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
课程收益
掌握强化学习知识,并运用到具体工作中。
讲师介绍
郭宪 更多讲师课程
南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016 年1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10 篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
课程大纲
第1章:强化学习概述
1. 强化学习概述 01:34:30
2. Python基础 5:06
3. Numpy基础 3:56
4. Gym环境介绍 15:54
5. 第一节作业 21:24
第2章:马尔科夫决策过程
1. 马尔科夫决策过程(上) 40:19
2. 马尔科夫决策过程(中) 01:01:50
3. 马尔科夫决策过程(下) 34:28
第3章:基于模型的动态规划方法
1. 马尔科夫决策过程示例编程 01:19:20
2. 基于动态规划的强化学习方法讲解 01:07:07
第4章:蒙特卡罗方法
1. 基于动态规划的强化学习编程示例讲解 01:24:30
2. 理解基于蒙特卡洛的强化学习算法 21:28
3. 理解On-policy 和 off-policy 34:09
第5章:时间差分方法
1. 时间差分方法 02:19:04
第6章:Gym环境构建及强化学习算法实现
1. Gym 环境构建及强化学习算法实现 02:11:07
第7章:值函数逼近方法
1. 函数逼近方法理论介绍 01:38:18
2. TensorFlow简介 15:10
3. 基于gym和TF的强化学习编程演示 26:19
第8章:DQN方法及其变种
1. 神经网络介绍 01:08:57
2. DQN算法及变种 34:53
3. DQN编程实例讲解 31:30
第9章:策略梯度方法
1. 策略梯度理论知识讲解 01:55:30
2. 其他算法概述 35:06
大家可以点击【 查看详情】查看我的课程
课程介绍
深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。 强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
课程收益
掌握强化学习知识,并运用到具体工作中。
讲师介绍
郭宪 更多讲师课程
南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016 年1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10 篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
课程大纲
第1章:强化学习概述
1. 强化学习概述 01:34:30
2. Python基础 5:06
3. Numpy基础 3:56
4. Gym环境介绍 15:54
5. 第一节作业 21:24
第2章:马尔科夫决策过程
1. 马尔科夫决策过程(上) 40:19
2. 马尔科夫决策过程(中) 01:01:50
3. 马尔科夫决策过程(下) 34:28
第3章:基于模型的动态规划方法
1. 马尔科夫决策过程示例编程 01:19:20
2. 基于动态规划的强化学习方法讲解 01:07:07
第4章:蒙特卡罗方法
1. 基于动态规划的强化学习编程示例讲解 01:24:30
2. 理解基于蒙特卡洛的强化学习算法 21:28
3. 理解On-policy 和 off-policy 34:09
第5章:时间差分方法
1. 时间差分方法 02:19:04
第6章:Gym环境构建及强化学习算法实现
1. Gym 环境构建及强化学习算法实现 02:11:07
第7章:值函数逼近方法
1. 函数逼近方法理论介绍 01:38:18
2. TensorFlow简介 15:10
3. 基于gym和TF的强化学习编程演示 26:19
第8章:DQN方法及其变种
1. 神经网络介绍 01:08:57
2. DQN算法及变种 34:53
3. DQN编程实例讲解 31:30
第9章:策略梯度方法
1. 策略梯度理论知识讲解 01:55:30
2. 其他算法概述 35:06
大家可以点击【 查看详情】查看我的课程