三家学派 符号主义 进化主义 连接主义
3.1 solve in AI
状态
行为
目标
4.2
4.2.1 Hill-Climbing 爬山法
局部搜索家族 一种迭代算法
1.开始时选择问题的一任意解
2.递增的修改该解的一个元素
3.若得到一个更好的解 则将该修改作为新的解
4.重复上诉3步操作
状态空间地形图
爬山法的弱点
1.局部最大
2.高原
3.山岭 一系列局部最大值
爬山法的变形
随机爬山法 向上移动时 随机选择
首选爬山法 随机生成后继点 直到生成一个比当前状态好的点
随机重启爬山法 它十分完备, 概率逼近1,因为最终它将生成一个目标状态作为初始状态。如果每次爬山搜索成功的概率为p,则重启需要的期望值是1/p
4.2.2 局部束搜素
在内存中仅保留一个节点 较为极端 所以提出局部束搜索保持k个状态而不为1。
4.2.3 禁忌搜索
用于确定解的数据结构被称为禁忌表
禁忌搜索的三种策略
禁止策略 控制何物进入该禁忌表
释放策略 控制何物以及何时退出该禁忌表
短期策略 管理禁止策略和释放策略之间的相互作用来选择试验解
4.3.1 退火
模拟退火 给定函数逼近全局最优解的概率方法
初始解 用启发式方法生成。 随机选择
相邻节点 随机生成。当前解的变异。
接受条件 相邻节点具有较低代价值,具有较高代价值的相邻节点则以概率P接受。
停止判据 解具有比阈值低的值。已达到迭代最大总次数。
遗传算法
有性繁殖,
搜索启发式算法
遗传、 突变、选择、以及杂交。
初始种群 适应 选择 杂交 变异
4.4 Swarm Intelligence--------群体智能
5.1博弈论
对抗搜索通常称为博弈
博弈论的定义
博弈论的定义
最小最大算法 |
用评价函数和选择性搜索下国际象棋 |
用评价函数和选择性搜索下国际象棋 |
学习自身的评价函数的西洋跳棋程序 |
5.2 游戏中的最优决定
最优解
普通搜索
对抗搜索
最小最大定理
5.3Alpha-Beta Pruning
alpha–beta剪枝
是一种搜索算法, 旨在削减由minimax算法评价的节点数量
博弈树
5.5Stochastic Games 随机对策
随机博弈
5.6Monte-Carlo Methods 蒙特卡罗
经典蒙特卡罗
量子蒙特卡罗
容积式蒙特卡罗
动力学蒙特卡罗
Minimax算法与α-β剪枝
6Constraint Satisfaction Problems (CSPs)
约束满足问题
PEAS-- 性能、环境、执行器、传感器(人工智能的任务环境)
无监督算法
机器学习术语
学习式特征
标记
训练样本
验证样本
测试样本
损失函数
假设集
抽象
泛华 将抽象知识转化为可用于动作形式的过程。
强AI
强人工智能就是能够执行“通用任务”(Generalized Mission)的人工智能:它能够进行想人类一样有的学习、推理和认知解决问题, 而且不是在特定领域中的问题。按照大众逻辑的想象,它就是真正的人工智能
弱AI
相对与弱人工智能我们对于人工智能的定义就广泛的多了。可以说目前市场上我们所见到的人工智能,或者说能够帮助我们解决特定领域的一些问题的人工智能,都可以说是弱人工智能。
工人智能的一举一动都是按照程序设计者的程序所驱动;如出现的特殊情况,程序者做出相对应的方案,最后由机器去判断是否符合条件并加以执行。
超AI
所谓不确定性推理原理就是从不确定性初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的结论的方法或理论。
监督学习问题分为“回归”和“分类”问题。
在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。
在分类问题中,我们试图预测离散输出中的结果。换句话说,我们试图将输入变量映射到离散类别。
Agent的定义
Agent指一种实体,而且是一种具有智能的实体。这种实体可以是智能软件 设备 机器人或者计算机系统 甚至可以是人
自主性
交互性
反应性
主动性