1-2讲

一、人工智能的历史

1、现实的困难
翻译、不同组合求解局限于小问题、产生智能行为的基本结构的根本局限性(感知机)

2、基于知识的系统——专家系统仅限于局部领域没有学习能力

3、知识引擎的新发展
成为产业、神经网络的回归、其他机器学习方法的出现、智能Agent及其应用、极大数据集的可用性

二、智能Agent

Agent通过感知器感知环境并通过执行器对所处的环境产生影响
eg:机器人Agent——摄像头、红外测距仪

1、理性Agent

(信息收集、自主性、能够进行学习)

①一个Agent应该根据她所感知的信息而产生一个行为
②该行为是正确的(该行为能取得最大的性能)

理性判断的4个因素(吸尘器问题)
①先验知识(地形)
②可以完成的动作(向左向右吸尘)
③截至此刻的感知序列(位置和灰尘)
④性能度量(清洁加分)

2、学习Agent

4个组件:
①性能元件:相当于整个Agent
②评判元件:反应性能元件做得如何
③学习元件:负责改进提高
④问题产生器:提出一些新的有建设性的探索尝试
(出租车行驶)

3、任务环境(▲)

1、任务环境四要素:

性能、环境、执行器、感知器

2、环境的性质

①完全可观察、部分可观察
每个时间点上获取环境的完整状态(国际象棋)和部分状态(自动驾驶汽车)。

②单Agent、多Agent
独自运行(字谜游戏)、同时运行(国际象棋)

③确定的、随机的
确定的环境下一个状态完全取决于当前状态和agent执行的行为,否则为随机的(真空吸尘器、出租车驾驶)

④片段式的、延续式的
agent经历被分成一个个原子片段,下一个片段不依赖于以前的片段(检查次品零件的机器人)
延续式的环境当前决策影响未来(国际象棋)

⑤静态的、动态的
环境在agent计算时不会发生变化、会变化

⑥离散的、连续的

4、Agent程序

①以传感器得到的当前感知信息为输入
②以执行器的行为为输出
仅仅以当前感知为输入而不是以整个历史感知为输入

Agent的表驱动方法——表太大、创建表时间长、非自主性、需要人工填写

5、Agent的类型(▲)

四种基本类型:

①简单反射agent
基于当前的感知选择行为,不关注历史(真空吸尘器、刹车行为)

②基于模型的反射agent
Agent根据感知历史维持内部状态、随时更新内部状态信息

③基于目标的agent
除了根据感知信息之外,还要根据目标信息来选择行动 ,效率比较低,需要推理(搜索和规划算法)

④基于效用的agent
当达到目标行为有很多种的时候,就需要考虑效率
用途:
环境是部分可观察和随机的,不确定下的决策过程可以通过基于效用的agent来实现(在不确定环境中)、多目标冲突、一个目标有多种行为可以达到

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值