《人工智能——一种现代方法》第二章读书笔记

本书认为,人工智能讨论核心即是围绕“何为智能Agent,如何构造智能Agent这两个命题"展开。

智能Agent的搭建结构有以下逻辑次序的进化:

1.Agent与环境交互

2.在1的基础上(之后每步均基于前面基础),标明Agent内部由传感器(Sensors)与执行器(Actuators)构成。传感器围绕“外界环境状况如何”理念建设,执行器围绕“我现在应该做什么”理念建设。

3.简单反射Agent:为执行器加上条件-行为规则,

4.基于模型反射Agent:为传感器理念加上以下解答规则:内部状态变化;世界模型变化;认识自己已经进行的行为。

5.基于目标的Agent:在传感与执行之间添加预测步骤:“我做了某种行为会带来怎样的结果”;执行理念修改为以目标为驱动

6.基于效用的Agent:在预测与执行间添加效用估计步骤:“我在此种状态下会有多‘快乐’(更加提高效用)”

摘抄本章小结:

Agent设计科学要点回顾:

*Agent是可以感知环境并在环境中行动的事物。

*Agent函数指定Agent响应任何感知序列所采取行动。

*性能度量评价Agent在环境中行为表现。给定感知序列,理性Agent行动追求性能度量预期值最大化。

*任务环境规范包括性能度量、外部环境、执行器、传感器。设计Agent时第一步总是将任务空间定义尽可能完全

*任务环境从不同维度看有很多变化。它们可能是 1.完全或部分可观察的 2.单或多Agent的 3.确定性或随机性的 4.片段式或延续式的 5.静态或动态的 6.离散或连续的 7.已知和未知的

*Agent程序是Agent函数的实现,各种基本Agent程序设计反映现实表现的以及用于决策过程的信息种类。设计可在效率、压缩性、灵活性方面有变化。适当Agent程序设计依赖于环境本性。

*所有Agent都可通过学习来改进性能


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值