AI一种现代的方法 第二章 智能体

本章讨论智能体的特性、完美以及其他,环境的变化性,以及多样的智能体类型。

第一章定义了AI的核心是理智的智能体。本章我们加强概念。我么可以预测,理智的概念在理想环境下应用在不同的智能体的操作中。本书我们的计划是用这个概念为创建成功的智能体发展一系列小的设计理念。

首先我们检测智能体、环境、以及两者的关系。不同的环境下智能体的行为有好坏之分。在自然环境里智能体行为能有多好?我们粗糙的分类了一下环境种类,以及环境的属性为何会影响合适的智能体?

我们提出了几种智能体设计框架。

2.1 智能体与环境

智能体可以通过传感器(sensors)感知环境并通过执行器(actuators)做出行动。

人的传感器:眼睛、耳朵…

人的执行器:手、脚、声带…

机器人的传感器:摄像头、红外测距仪…

机器人的执行器:发动机…

软件的传感器:键盘、文件内容、网络数据包…

软件的执行器:屏幕、写文件、发送数据包…

 

我们用感知(Percept)代表智能体所有能感知到的输入。

感知顺序(Percept Sequence)

感知功能(Percept Function)

感知程序(Percept program)

2.2 理性的概念

理智的智能体能做正确的事情。

Performance measure

2.2.1 理性

智能体的定义:理智的智能体,从可能的感知序列选择能最大化表现评价并根据感知序列和先验知识提供证据的行为。

信息收集(Information gathering)

2.3 环境的天性

任务环境(Task environment)

2.3.1 具化任务环境

Task environment :PEAS Performance Environment Actuators Sensors

以自动驾驶为例:

智能体类型(Agent Type) 计程车驾驶

Performance:安全、快速、合法、舒适、最大利润

Environment:道路、其他车辆、行人、顾客

Actuators:方向盘、加速器、刹车、信号、喇叭、显示

Sensors: 摄像头、声纳、记速器、GPS、里程表、加速表、引擎传感器、键盘

2.3.2 任务环境属性

Fully observable & partially observable

Deterministic & stochastic

Static & dynamic & semi dynamic

Discrete & continuous

Known & unknown

2.4 智能体结构

目前我们讨论了智能体的行为,根据一系列感知序列做出的反应。现在需要讨论内部机制。AI的工作是设计智能体程序来实现智能体的功能-从感知到行为。假设程序运行在有物理传感器和执行器的计算设备上,我们称为结构。

agent=architecture+program.

2.4.1

本书讨论的结构的共性:把传感器得到的当前感知作为输入,再返回对执行器的行为。

四种类型的智能体程序

Simple reflex agents:简单的反射体

Model-based reflex agents基于模型的反射体

Goal-based agents基于目标的智能体

Utility-based agents基于效用的智能体

 

在阅读本书的时候,得到的人生启发,共享一下:

The process of looking for a sequence of actions that reaches the goal is called search.

路漫漫其修远兮,吾将上下而求索。想要达到目标,我们就得展开一系列的行动,这个过程就是搜索。(探索、求索)

Partial observability and stochasticity are ubiquitous in the real world, and so, therefore, is decision making under uncertainty.

生活的真相和确定性,我们终究只能掌握一二,我们只能在不确定的情况下作决策。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值