一、人工智能的历史
1、现实的困难
翻译、不同组合求解局限于小问题、产生智能行为的基本结构的根本局限性(感知机)
2、基于知识的系统——专家系统仅限于局部领域没有学习能力
3、知识引擎的新发展
成为产业、神经网络的回归、其他机器学习方法的出现、智能Agent及其应用、极大数据集的可用性
二、智能Agent
Agent通过感知器感知环境并通过执行器对所处的环境产生影响
eg:机器人Agent——摄像头、红外测距仪
1、理性Agent
(信息收集、自主性、能够进行学习)
①一个Agent应该根据她所感知的信息而产生一个行为
②该行为是正确的(该行为能取得最大的性能)
理性判断的4个因素(吸尘器问题)
①先验知识(地形)
②可以完成的动作(向左向右吸尘)
③截至此刻的感知序列(位置和灰尘)
④性能度量(清洁加分)
2、学习Agent
4个组件:
①性能元件:相当于整个Agent
②评判元件:反应性能元件做得如何
③学习元件:负责改进提高
④问题产生器:提出一些新的有建设性的探索尝试
(出租车行驶)
3、任务环境(▲)
1、任务环境四要素:
性能、环境、执行器、感知器
2、环境的性质
①完全可观察、部分可观察
在每个时间点上获取环境的完整状态(国际象棋)和部分状态(自动驾驶汽车)。
②单Agent、多Agent
独自运行(字谜游戏)、同时运行(国际象棋)
③确定的、随机的
确定的环境下一个状态完全取决于当前状态和agent执行的行为,否则为随机的(真空吸尘器、出租车驾驶)
④片段式的、延续式的
agent经历被分成一个个原子片段,下一个片段不依赖于以前的片段(检查次品零件的机器人)
延续式的环境当前决策影响未来(国际象棋)
⑤静态的、动态的
环境在agent计算时不会发生变化、会变化
⑥离散的、连续的
4、Agent程序
①以传感器得到的当前感知信息为输入
②以执行器的行为为输出
仅仅以当前感知为输入而不是以整个历史感知为输入
Agent的表驱动方法——表太大、创建表时间长、非自主性、需要人工填写
5、Agent的类型(▲)
四种基本类型:
①简单反射agent
基于当前的感知选择行为,不关注历史(真空吸尘器、刹车行为)
②基于模型的反射agent
Agent根据感知历史维持内部状态、随时更新内部状态信息
③基于目标的agent
除了根据感知信息之外,还要根据目标信息来选择行动 ,效率比较低,需要推理(搜索和规划算法)
④基于效用的agent
当达到目标行为有很多种的时候,就需要考虑效率
用途:
环境是部分可观察和随机的,不确定下的决策过程可以通过基于效用的agent来实现(在不确定环境中)、多目标冲突、一个目标有多种行为可以达到