强化学习深入浅出完全教程-郭宪-专题视频课程

最新推荐文章于 2021-07-28 22:58:53 发布

gxsia

最新推荐文章于 2021-07-28 22:58:53 发布

阅读量1.5k

点赞数

分类专栏：视频教程文章标签：人工智能-强化学习强化学习人工智能

本文链接：https://blog.csdn.net/gxsia/article/details/83579996

版权

视频教程专栏收录该内容

1 篇文章 1 订阅

订阅专栏

强化学习深入浅出完全教程—1972人已学习
课程介绍

    深入浅出地介绍强化学习的概念，算法发展历史，分类，及发展趋势。强化学习深入浅出完全教程，内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
课程收益
    掌握强化学习知识，并运用到具体工作中。
讲师介绍
    郭宪更多讲师课程
    南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业，同年保送到中国科学院沈阳自动化研究所进行硕博连读，主攻机器人动力学建模与控制，于2016 年1 月获得工学博士学位，期间在国内外知名杂志和会议发表论文数10 篇。2016年以来，郭博士主攻方向为机器人智能感知和智能决策，目前主持两项国家级课题，内容涉及深度学习，深度强化学习等智能算法在机器人领域中的应用。
课程大纲
  第1章:强化学习概述
    1. 强化学习概述  01:34:30
    2. Python基础  5:06
    3. Numpy基础  3:56
    4. Gym环境介绍  15:54
    5. 第一节作业  21:24
  第2章:马尔科夫决策过程
    1. 马尔科夫决策过程（上）  40:19
    2. 马尔科夫决策过程（中）  01:01:50
    3. 马尔科夫决策过程（下）  34:28
  第3章:基于模型的动态规划方法
    1. 马尔科夫决策过程示例编程  01:19:20
    2. 基于动态规划的强化学习方法讲解  01:07:07
  第4章:蒙特卡罗方法
    1. 基于动态规划的强化学习编程示例讲解  01:24:30
    2. 理解基于蒙特卡洛的强化学习算法  21:28
    3. 理解On-policy 和 off-policy  34:09
  第5章:时间差分方法
    1. 时间差分方法  02:19:04
  第6章:Gym环境构建及强化学习算法实现
    1. Gym 环境构建及强化学习算法实现  02:11:07
  第7章:值函数逼近方法
    1. 函数逼近方法理论介绍  01:38:18
    2. TensorFlow简介  15:10
    3. 基于gym和TF的强化学习编程演示  26:19
  第8章:DQN方法及其变种
    1. 神经网络介绍  01:08:57
    2. DQN算法及变种  34:53
    3. DQN编程实例讲解  31:30
  第9章:策略梯度方法
    1. 策略梯度理论知识讲解  01:55:30
    2. 其他算法概述  35:06
大家可以点击【查看详情】查看我的课程