Agent及其理性
Agent:通过传感器感知所处环境并通过执行器对该环境产生作用的智能体
Agent感知序列:该Agent所接收到的是所有输入数据的完整历史
感知信息:智能体的感知输入
感知序列:感知信息的集合
Agent函数:描述Agent行为,将任意给定感知序列映射为行动
Agent程序:实现Agent函数
The agent function describes what the agent does in all circumstances
The agent program calculates the agent function
理性的概念
理性:Agent的一种属性,考虑到迄今为止的感知,他们选择能够最大化其预期效用的行为。
理性(Rationality)Agent:对于每个可能的感知序列,根据已知的序列提供的证据和智能体内建的先验知识,理性智能体应该选择期望能使其性能最大化的行动。
Rationality depends on:
- The performance measure that defines the criterion of success
- The agent’s prior knowledge of the environment
- The actions that the agent can perform
- The agent’s percept sequence to date
性能度量、先验知识、可执行行动、感知序列
全知Agent:全知Agent明确知道他的行动产生的实际结果并做出相应的动作,现实中不可能。理性 ≠ 全知
完美Agent:理性Agent使期望性能最大化;完美Agent使实际性能最大化。理性 ≠ 完美
理性Agent还应该是自主的,它应该学习,以弥补不完整的或者不正确的先验知识。
PEAS及环境特性
任务环境的规范包括:
To design a rational agent we need to specify a task environment
- Performance measure
- Environment
- Actuators
- Sensors
PEAS(性能Performance,环境 Environment, 执行器Actuators, 传感器Sensors)
例如,在Spam Filtering垃圾邮件过滤中
- Performance measure: spam block
- Environment: email client or server
- Actuators: mark as spam, transfer messages
- Sensors: emails (possibly across users), etc.
任务环境的属性
- 完全可观测和部分可观测
Agent的Sensors在每个时间点上都能获取环境的完整状态。若监测到的信息与行动决策相关,则该任务环境是有效完全可观察的。 - 单Agent和多Agent
- 确定的和随机的
- 片段式的和延续式的
片段:下一个片段不依赖于以前片段采取的行动(如大部分的分类任务)。
连续:当前决策会影响到所有未来决策。 - 静态的和动态的
取决于环境在Agent计算时是否会改变。 - 离散的和连续的
环境状态,时间处理方式,Agent感知信息和行动 都有离散和连续之分。
Agent的结构
Agent = 体系结构 + 程序(Agent程序)
体系结构,具有物理传感器和执行器的计算装置
智能体程序,每接收到一个新的感知信息,就将其添加到感知序列中,并根据先验知识的对应表得到一个行动,把传感器的感知信息映射到行动的Agent函数
All agents have the same skeleton
- Input = current percepts
- Output = action
- Program= manipulates input to produce
output
Four basic types in order of increasing generality
- Simple reflex agents 简单反射agent,忽略感知序列,而只针对当前感知选择行动。
- Model-based reflex agents 基于模型的agent
- Goal-based agents 基于目标的agent
基于目标的agent会考虑将要采取的行动及行动的后果,即与目标还有多远 - Utility-based agents 基于效用的agent,最大化期望
- Learning agents 学习agent
All these can be turned into learning agents
Agent程序的部件如何运转
各部件的工作
- 原子表示
- 要素化表示(状态有特征向量)
- 结构化表示(特征向量+其他对象的关系)
小结
要点回顾如卜:
Agent是可以感知环境并在环境中行动的事物。
Agent函数指定Agent响应任何感知序列所采取的行动。
性能度量评价Agent在环境中的行为表现。给定Agent的感知序列,理性Agent行动追求性能度量预期值最大化。
任务环境的规范包括性能度量,外部环境,执行器和传感器。设计Agent时,第一步总是把任务空间定义得尽可能完全。
任务环境从不同的维度看有很多变化。它们可能是完全或部分可观察的,单Agent或多Agent的,确定性的或随机的,片段式的或延续式的,静态的或动态的,离散的或连续的,已知的和未知的。
Agent程序是Agent函数的实现。 有各种基本的Agent程序的设计,反映出显式表
现的以及用于决策过程的信息种类。设计可能在效率、压缩性和灵活性方面有变化。适当的 Agent 程序的设计依赖于环境的本性。
简单反射Agent直接对感知信息做出反应。基于模型的反射Agent保持内部状态,其操作直接从当前世界状态的内部模型派生,并随时间更新。基于目标的Agent选择能实现显示表示的目标的动作,而基于效用的Agent试图选择能最大化它期望效用的动作。
所有Agent都可以通过学习来改进它们性能。
资源分享
实验代码下载:
https://github.com/yyl424525/AI_Homework
人工智能-一种现代方法中文第三版pdf、课件、作业及解答、课后习题答案、实验代码和报告、历年考博题下载:https://download.csdn.net/download/yyl424525/11310392