【强化学习】1.1.3 强化学习基本框架


title: [强化学习] 1.1.3 强化学习基本框架
categories:
- Reinforcement Learning
- RL-An Introduction
keywords:
- agent
- real-time
- organism
- robot
- framwork
toc: true
date: 2018-08-29 23:18:29


Abstract: 本文简要介绍强化学习的框架,以及框架中几个概念的基本关系
Keywords: agent,real-time,organism,robot,framwork

Reinforcement Learning Framework

上来就把这篇的核心知识点讲出来吧,对于一个RL任务,其框架从总体上分,包括:

  1. agent
  2. agent’s environment

我不知道怎么翻译agent这个词,所以就一直用英文了,代理,或者特工都不太合适,而且我总能想到Agent Hunter。。agent我们已经用了好多次了,到现在都不知道是什么,是算法,还是算法和其他的什么的合集,就像模型一样,可能用了很久都不知道所谓模型,架构到底是什么,而我们在后面会用详细的例子来形容agent是什么。
就像数学分析里面的定义一样,一个限定加命名而已。所以不要过于担心这一点。

Agent

虽然不知道agent到底是什么,有没有枪什么的,但是我们知道他有以下几个特点:

  • explicit goal(明确的目标)
  • sense aspect of their environment(对他们的环境敏感)
  • choose action to influnce their environment(选择action来改变environment)

即使在算法的刚开始,agent没有任何经验,比如对于一个刚学会下棋规则的人来说,他没有任何经验,但是他也要对棋局做出反应,瞎弄都可以,但是你不能楞在那,这是不可以的,agent要对环境做出action,即使是未知环境。

如果包含planning的过程,agent不能一直planning,要平衡planning和real-time之间的关系,还有环境模型如何生成和提升等(这几句话如果不懂,不用急,因为这个是更复杂的RL,后面回头看会好一些)

如果RL包含监督学习的部分,agent还有个任务就是判断哪个监督学习模型的能力强,哪个弱(这个同样是复杂版本的RL,也需要后面的知识来融汇贯通)

本文为节选,完整内容地址:https://face2ai.com/RL-RSAB-1-1-3-Reinforcement-Learning/转载标明出处

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值