强化学习
wongHome
种一棵树最好的时间是十年前,其次是现在.
展开
-
【百度飞桨强化学习7日打卡营】学习笔记 -- 第五课:连续动作空间求解RL
写在前面 本次课程是参加百度飞桨7日打卡营活动的第四天笔记。 课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335 主要内容:DDPG 实践:DDPG 一、强化学习原创 2020-06-25 21:49:38 · 510 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第四课:基于策略梯度求解RL
写在前面 本次课程是参加百度飞桨7日打卡营活动的第四天笔记。 课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335 主要内容:策路近似、策路梯度 实践:Policy Gradient 一、强化学习原创 2020-06-25 15:38:56 · 324 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第三课:基于神经网络方法求解RL
写在前面 本次课程是参加百度飞桨7日打卡营活动的第二天笔记。 课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335 主要内容:函数逼近方法 实践:DQN 一、强化学习原创 2020-06-25 00:33:16 · 261 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第二课:基于表格型方法求解RL
写在前面 本次课程是参加百度飞桨7日打卡营活动的第二天笔记。 课程链接:https://aistudio.baidu.com/aistudio/education/group/info/1335 主要介绍RL概述、入门路线、环境搭建 一、强化学习原创 2020-06-24 16:40:09 · 291 阅读 · 0 评论 -
【百度飞桨强化学习7日打卡营】学习笔记 -- 第一课:强化学习(RL)初印象
写在前面 本次课程是参加百度飞桨7日打卡营活动的第一天笔记。 课程导入 人工智能可以像人一样模仿、像人一样自学。 强化学习的推荐学习路线: 课程需要提前学习的知识与资料推荐: 第一课:强化学习(RL)初印象 主要介绍RL概述、入门路线、环境搭建 一、什么是强化学习 走迷宫的例子显示了强化学习的特点: 与环境的交互特点:agent的策略是一连串的序列决策,会不断与环境进行交互; 奖励的延迟特点:不会运行每一步都会告诉你输出的动作对不对,只有把所有的步骤都执行结束之后,才知道是否成功。 二、强化原创 2020-06-24 09:42:52 · 392 阅读 · 0 评论