reinforce learning
imcl
keep hungry and practise more
展开
-
Reinforce learning: Lecture 1 Introduction to Reinforcement Learning 学习笔记
强化学习是什么?首先我们先从一个简单的例子开始,大家都知道,当我们刚出生时,对地球的重力规则肯定是一无所知的,但经过摸爬滚打,我们慢慢地学会了走路,这一过程可以简化表示为:我们和地面经过多次的交互,增强了我们的能力。强化学习主要由以下及部分组成:agent: 机器人enviroment:环境action:agent的行为reward: environment 对 action的...原创 2018-03-07 20:58:29 · 869 阅读 · 0 评论 -
A3C
A3C tutorial原创 2018-04-14 16:13:15 · 928 阅读 · 0 评论 -
OpenAI
IntroductionOpenAI 是google提供的一个环境库,用以测试和对比不同强化学习算法。下载地址:OpenAIBasic在强化学习中,有两个重要的概念:环境与环境交互的人(你所设计的算法)环境的作用: 接受agent作出的某种action,并给予agent反馈,反馈信息主要包含reward 和 一些可观测状态量。agent的作用: 根据反馈信息,...原创 2018-04-10 17:26:43 · 3497 阅读 · 0 评论 -
L2: Markov Decision学习笔记
前言本节主要讲述了MP、MRP、MDP的基本概念,并介绍了Bellman方程在计算状态/动作值函数中的应用,进一步说明何为最优策略,最后介绍了MDP的几种扩展形式,例如POMDP。MP 马尔科夫过程具有无记忆性,MP可以用元组<S,P>来表示,S代表状态,P表示状态之间的转移矩阵, 从示例来看,MP仅含有S、P。MRP 相比...原创 2018-04-10 20:36:17 · 250 阅读 · 0 评论 -
PER
DDQN-PERtutorial原创 2018-11-05 16:37:33 · 365 阅读 · 1 评论