第三章.互联网情景下的智能决策——从智能体看到强化学习的应用

准备开始强化学习的内容了!
鸡冻.jpg
在这里插入图片描述

1.从智能体开始入门

这里参考了一篇不错的小文章
智能体到底是什么?这里有一篇详细解读
写得狠不戳!这里总结一下
另外 本课程的参考书 中对本模块的描述如下
人工智能 一种现代方法 第2章 智能化智能体

什么是智能体?

智能体通过传感器感知其周围环境 通过执行器对其进行操作
智能体在感知 思考 行动的周期中往返运行。

【1】以人类为例,

  • 我们是通过人类自身的五个感官(传感器)来感知环境的,
  • 然后我们会对环境进行一个思考
  • 继而使用我们的身体部位(执行器)去执行操作

【2】类似人类,智能体——

  • 通过传感器(人类提供给它的)来感知环境 这些传感器可能是相机 麦克风 红外探测器
  • 然后进行一些计算(就是人类的思考环节)
  • 继而使用各种各样的电机/执行器来执行操作

我们周围的世界充满了各种智能体 我们的手机、真空清洁器、智能冰箱、恒温器、相机、根据上面是否有人调节速度的自动扶梯、甚至我们自己。

不同类型的智能体

一般有四种类型的智能体 根据智能水平或其能够执行任务的复杂性不同而区分
所有类型都可以随着时间的推移改进性能并产生更好的操作。这些可以概括为学习智能体(learning agents)。

因为现在的强化学习还是在研究阶段
所以这四个不同类型的智能体(越往后越复杂越先进)一个比一个的例子少!
到了“基于效用的智能体” 举出来的例子大多都是活的例子 像我们人类 人类的一些行为才符合这个概念!

单反射性智能体(simple reflex agents)

这些选择操作仅基于当前状态,忽略感知历史。

戴森风扇可以通过空气中灰尘的浓度来选择不同的档进行空气净化

如果环境完全可观察到,或者正确的行为是基于目前的感知,它们才能工作。

比如说智能家居 靠近就会自动打开的柜门之类的~单反射性智能体无法记录感知历史,是很简单的。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值