人工智能一种现代的方法第2章智能Agent

最新推荐文章于 2024-07-11 09:35:54 发布

lvxiangyu11

最新推荐文章于 2024-07-11 09:35:54 发布

阅读量692

收藏 4

点赞数

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lvxiangyu11/article/details/86726296

版权

人工智能专栏收录该内容

8 篇文章 0 订阅

订阅专栏

Agent的本质，完美性，环境多样性，分类

环境

Agent感知序列：该Agent所接收到的是所有输入数据的完整历史。

Agent函数：描述Agent行为，将任意给定感知序列映射为行动

Agent程序：人造Agent函数的实现。

理性的概念
1. 理性

对每个可能的感知序列，根据已有的感知序列提供的证据和Agent具有的先验知识，理性Agent应该选择能使其新能最大化的行动。

1. 全知、学习、自主性

全知Agent明确知道他的行动产生的实际结果并做出相应的动作，现实中不可能。

Agent要从它感知的信息中尽可能地学习。

自主性使Agent不只依赖于先验知识，也依赖于自身的感知信息。

环境的性质
1. 任务环境的描述规范

PEAS描述：Performance，Environment，Actuators，Sensors

1. 任务环境的性质
  1. 完全可观察与部分可观察

Agent的Sensors在每个时间点上都能获取环境的完整状态。

若监测到的信息与行动决策相关，则该任务环境是有效完全可观察的。

1. 1. 单Agent与多Agent

对抗，竞争性/

1. 1. 确定的与随机的

环境的下一个状态完全取决于当前状态和Agent执行的行动则环境是确定的。

1. 1. 片段式与连续式

片段：下一个片段不依赖于以前片段采取的行动（如大部分的分类任务）。

连续：当前决策会影响到所有未来决策。

1. 1. 静态与动态

取决于环境在Agent计算时是否会改变。

1. 1. 离散与连续

环境状态，时间处理方式，Agent感知信息和行动都有离散和连续之分。

1. 1. 已知与未知
结构

Agent = 体系结构（计算设备） + 程序（Agent程序）

1. 简单反射Agent

1. 基于模型的反射Agent

1. 基于目标的Agent

1. 基于效用的Agent

1. 学习Agent

学习元件负责改进提高，性能原件负责选择外部行动。问题发生器负责可以得到新的和有信息的经验的行动建议。

各部件的工作

原子表示 2. 要素化表示（状态有特征向量） 3. 结构化表示（特征向量+其他对象的关系）

lvxiangyu11

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
人工智能一种现代的方法第2章智能Agent

Agent的本质，完美性，环境多样性，分类环境Agent感知序列：该Agent所接收到的是所有输入数据的完整历史。Agent函数：描述Agent行为，将任意给定感知序列映射为行动Agent程序：人造Agent函数的实现。理性的概念理性对每个可能的感知序列，根据已有的感知序列提供的证据和Agent具有的先验知识，理性Agent应该选择能使其新能最大化的行动。全知、...
复制链接

扫一扫

专栏目录

lvxiangyu11

博客等级

码龄14年

63
原创

41
点赞

135
收藏

42
粉丝

关注

私信

分类专栏

最新评论

CDUA 图形学 Surface Object实验
weixin_50919853: 我是一个初学者，感谢你的示例代码！然而，我观察到line96手动生成了fake数据。注释掉line96后，输出全为0，而不是预期的“复制h_data初始值”。经过尝试，我认为bug在于： line 92: 使用了错误的复制函数，导致无法完成数据从设备到主机的复制。应改为：cudaMemcpyFromArray(h_data, cuOutputArray, 0, 0, size, cudaMemcpyDeviceToHost);
esp32 micropython 获取本地wifi的MAC地址
lvxiangyu11: 看手册
esp32 micropython 获取本地wifi的MAC地址
fantasy225: 怎么设置蓝牙的ip呢
OpenCL并行编程基础第五章
lvxiangyu11: 我什么时候学过这玩意？
[2019计算机视觉]——贪心学院学习笔记【大项目】自动驾驶之方向盘转动项目案例(端到端)
_biubiubiu_: 你好，我想问下文中的第5部分，5. 利用左侧的摄像头捕捉的画面，下面的截图是来自哪个课件啊？想去看一下

最新文章

2024年1篇

2023年1篇

2022年1篇

2019年26篇

2018年34篇

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值