强化学习深入浅出完全教程-郭宪-专题视频课程

强化学习深入浅出完全教程—1972人已学习
课程介绍    
201802241620459272.png
    深入浅出地介绍强化学习的概念,算法发展历史,分类,及发展趋势。 强化学习深入浅出完全教程,内容包括强化学习概述、马尔科夫决策过程、基于模型的动态规划方法、蒙特卡罗方法、时间差分方法、Gym环境构建及强化学习算法实现、值函数逼近方法、DQN方法及其变种、策略梯度方法。
课程收益
    掌握强化学习知识,并运用到具体工作中。
讲师介绍
    郭宪 更多讲师课程
    南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所进行硕博连读,主攻机器人动力学建模与控制,于2016 年1 月获得工学博士学位,期间在国内外知名杂志和会议发表论文数10 篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项国家级课题,内容涉及深度学习,深度强化学习等智能算法在机器人领域中的应用。
课程大纲
  第1章:强化学习概述
    1. 强化学习概述  01:34:30
    2. Python基础  5:06
    3. Numpy基础  3:56
    4. Gym环境介绍  15:54
    5. 第一节作业  21:24
  第2章:马尔科夫决策过程
    1. 马尔科夫决策过程(上)  40:19
    2. 马尔科夫决策过程(中)  01:01:50
    3. 马尔科夫决策过程(下)  34:28
  第3章:基于模型的动态规划方法
    1. 马尔科夫决策过程示例编程  01:19:20
    2. 基于动态规划的强化学习方法讲解  01:07:07
  第4章:蒙特卡罗方法
    1. 基于动态规划的强化学习编程示例讲解  01:24:30
    2. 理解基于蒙特卡洛的强化学习算法  21:28
    3. 理解On-policy 和 off-policy  34:09
  第5章:时间差分方法
    1. 时间差分方法  02:19:04
  第6章:Gym环境构建及强化学习算法实现
    1. Gym 环境构建及强化学习算法实现  02:11:07
  第7章:值函数逼近方法
    1. 函数逼近方法理论介绍  01:38:18
    2. TensorFlow简介  15:10
    3. 基于gym和TF的强化学习编程演示  26:19
  第8章:DQN方法及其变种
    1. 神经网络介绍  01:08:57
    2. DQN算法及变种  34:53
    3. DQN编程实例讲解  31:30
  第9章:策略梯度方法
    1. 策略梯度理论知识讲解  01:55:30
    2. 其他算法概述  35:06
大家可以点击【 查看详情】查看我的课程
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值