强化学习
文章平均质量分 81
刘狍狍同学
这个作者很懒,什么都没留下…
展开
-
强化学习(第三周)
强化学习 1、什么是强化学习 强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题,即自动进行决策,并且可以做连续决策。 它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。 类比强化学习和动物学习 训练幼犬的过程有两个要素: 饲养员需要对幼犬发出指令,比如让它“坐着”, 饲...原创 2018-08-25 21:31:46 · 1389 阅读 · 0 评论 -
模仿学习(第四周)
在传统的强化学习任务中,通常通过计算累积奖赏来学习最优策略(policy),这种方式简单直接,而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策(sequential decision)中,学习器不能频繁地得到奖励,且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习(Imitation Learning)的方法经过多年的发展,已经能够很好地解决多步决策问题,在机器人、 NL...原创 2018-09-01 21:17:22 · 1560 阅读 · 0 评论 -
模仿学习(第四周)
在传统的强化学习任务中,通常通过计算累积奖赏来学习最优策略(policy),这种方式简单直接,而且在可以获得较多训练数据的情况下有较好的表现。然而在多步决策(sequential decision)中,学习器不能频繁地得到奖励,且这种基于累积奖赏及学习方式存在非常巨大的搜索空间。而模仿学习(Imitation Learning)的方法经过多年的发展,已经能够很好地解决多步决策问题,在机器人、 NL...原创 2019-06-28 13:32:32 · 199 阅读 · 0 评论 -
强化学习(第三周)
强化学习 1、什么是强化学习 强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题,即自动进行决策,并且可以做连续决策。 它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。 类比强化学习和动物学习 训练幼犬的过程有两个要素: 饲养员需要对幼犬发出指令,比如让它“坐着”, 饲...原创 2019-06-28 13:32:51 · 143 阅读 · 0 评论