第三章.互联网情景下的智能决策——从智能体看到强化学习的应用

最新推荐文章于 2023-12-09 11:23:48 发布

敲代码的小提琴手

最新推荐文章于 2023-12-09 11:23:48 发布

阅读量501

点赞数 2

分类专栏：人工智能领域研究文章标签：强化学习智能体

嘿朋友谢谢你复制我的文章喜欢的话给点个赞交个朋友吧~

本文链接：https://blog.csdn.net/qq_45704942/article/details/115509881

版权

准备开始强化学习的内容了！
鸡冻.jpg
在这里插入图片描述

文章目录

1.从智能体开始入门
2.强化学习与监督/非监督学习的对比
3.强化学习框架
- 实例分析
4.强化学习的几个例子

1.从智能体开始入门

这里参考了一篇不错的小文章
智能体到底是什么？这里有一篇详细解读
写得狠不戳！这里总结一下
另外本课程的参考书中对本模块的描述如下
人工智能一种现代方法第2章智能化智能体

什么是智能体？

智能体通过传感器感知其周围环境通过执行器对其进行操作
智能体在感知思考行动的周期中往返运行。

【1】以人类为例，

我们是通过人类自身的五个感官（传感器）来感知环境的，
然后我们会对环境进行一个思考
继而使用我们的身体部位（执行器）去执行操作

【2】类似人类，智能体——

通过传感器（人类提供给它的）来感知环境这些传感器可能是相机麦克风红外探测器
然后进行一些计算（就是人类的思考环节）
继而使用各种各样的电机/执行器来执行操作

我们周围的世界充满了各种智能体我们的手机、真空清洁器、智能冰箱、恒温器、相机、根据上面是否有人调节速度的自动扶梯、甚至我们自己。

不同类型的智能体

一般有四种类型的智能体根据智能水平或其能够执行任务的复杂性不同而区分
所有类型都可以随着时间的推移改进性能并产生更好的操作。这些可以概括为学习智能体（learning agents）。

因为现在的强化学习还是在研究阶段
所以这四个不同类型的智能体（越往后越复杂越先进）一个比一个的例子少！
到了“基于效用的智能体” 举出来的例子大多都是活的例子像我们人类人类的一些行为才符合这个概念！

单反射性智能体(simple reflex agents)

这些选择操作仅基于当前状态，忽略感知历史。

戴森风扇可以通过空气中灰尘的浓度来选择不同的档进行空气净化

如果环境完全可观察到，或者正确的行为是基于目前的感知，它们才能工作。

比如说智能家居靠近就会自动打开的柜门之类的~单反射性智能体无法记录感知历史，是很简单的。

最低0.47元/天解锁文章

敲代码的小提琴手

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
第三章.互联网情景下的智能决策——从智能体看到强化学习的应用

准备开始强化学习的内容了！鸡冻.jpg1.从智能体开始入门这里参考了一篇不错的小文章智能体到底是什么？这里有一篇详细解读写得狠不戳！这里总结一下另外本课程的参考书中对本模块的描述如下人工智能一种现代方法第2章智能化智能体什么是智能体？智能体通过传感器感知其周围环境通过执行器对其进行操作智能体在感知思考行动的周期中往返运行。【1】以人类为例，我们是通过人类自身的五个感官（传感器）来感知环境的，然后我们会对环境进行一个思考继而使用我们的身体部位（执行器）去执行操作
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。