Chapter 13 人工智能
13.1 思维机
人工智能(AI,artificial intelligence): 研究对人类思想建模和应用人类智能的计算机系统的学科
A. 图灵测试
图灵测试(turing test): 一种行为方法,用于判断一个计算机系统是否智能
弱等价性(weak equvialence): 两个系统基于结果的等价性
强等价性(strong equivalence): 两个系统基于结果和实现这种结果的处理方法的等价性
Loebner奖(Loebner prize): 正式的图灵测试,每年举办一次
聊天机器人(chatbot): 用于执行人机对话的程序
B. AI问题的各个方面
· 知识表示 ———— 用于表示知识,以便计算机能够用来解决智能问题的技术
· 专家系统 ———— 嵌入人类专家知识的计算机系统
· 神经网络 ———— 模拟人脑处理的计算机系统
· 自然语言处理 ———— 处理人类用来交流的语言的难题
· 机器人学 ———— 关于机器人的研究
13.2 知识表示
表示一个对象或事件所需的知识会根据情况而有所不同。对于要解决的问题,我们需要特定的信息。
而且我们除了需要特定的信息,还需要一种形式,使得我们能够有效地检索和处理信息
两种新的知识表示方法 ———— 语义网和检索树
A. 语义网
语义网(semantic network): 是一种知识表示法,重点在于对象之间的关系,表示语义网的是有向图。
图中节点表示对象,节点之间的箭号表示关系,箭号上的标签说明关系的类型
语义网借用了很多面向对象的概念: 继承和实例化
继承说明一个对象是(is-a)另一个对象更具体的版本
实例化(instance-of)是一个真正的对象和这种对象的说明(如类)之间的关系
语义网是表示大量信息的强有力而通用的方式。难点在于建立正确的关系模型,用准确完整的数据
填充整个网络。
B. 检索树
检索树(search tree): 表示对抗性情况,(如博弈)中所有选择的结构
利用的方法就是搜索可能衍生出的所有情况 -- 构成树状
问题变成采用深度优先法(depth-first approach),总是先沿着可选的路径向下移动分析,
还是选用广度优先法(breadth-first approach),先分析所有可能的路径而不向下移动
13.3 专家系统
基于知识的系统(knowledge-based system): 嵌入并使用特定信息集合的软件,它从嵌入的信息集合中
提取和处理特定的片段
专家系统(expert system): 基于人类专家的知识构造的软件系统
专家系统使用一套规则来知道处理,因此又叫做基于规则的系统。专家系统的规则集合又称知识库
推理机是专家系统的一部分,决定了如何执行规则,以及从而会得到什么结论
基于规则的系统(rule-based system): 基于一套if-then规则的软件系统
推理机(inference engine): 处理规则以得出结论的软件
*** 专家系统不会对任何它可以查到的信息提问
专家系统的优点:
· 首先,它是面向目标的。它的重点不是抽象信息或理论信息,而是如何解决特定的问题
· 其次,它非常有效。它将记录之前的反应,不会问无关的问题。
· 最后,即使你不知道某些问题的答案,一个真正的专家系统也会通过精心构造的规则
集合提供有用的指示。
13.4 神经网络
人工神经网络(artificial neural network): 尝试模拟人体神经网络的计算机知识表示法
A. 生物神经网络
B. 人工神经网络
每个处理元素都类似一个生物神经元,接受一定数量的输入,生成一个0/1 的输出值
它具有有效权
有效权(effective weight): 人工神经元中输入值和相应的权的乘积之和
假设一个人工神经元接受的三个输入 v1、v2和v3,每个输入值的权分别是w1、w2和w3
那么它的有效权就是:
v1*w1 + v2*w2 + v3*w3
每个元素都有一个数字阈值,元素的有效权将与阈值比较。如果有效权大于阈值该元素生成1,
否则有效权小于等于阈值,该元素生成0.
人工神经网络中建立的一条路径是每个处理元素的函数。每个处理元素的输出将根据输入信号、
权和阈值而改变。不过输入信号只是其他元素的输出信号,因而改变单个处理元素的权和阈值
就可以影响神经网络的处理
调整神经网络中的权和阈值的过程叫做训练(training)。训练神经网络,可以使它生成任何需要的结果。
初识时,神经网络的权、阈值和初始输入通常是随机参数的。这样生成的结果将与想要的结果相比,
然后再调整其中的各个值,这一过程将持续到实现了想要的结果 -- 训练就是学习过程
13.5 自然语言处理
自然语言(natural language): 人们用于交流的语言,如英语
人机语音交互过程中的三种基本处理类型: -- 都是针对自然语言
· 语音识别(voice recogntion): 用计算机来识别人类所讲的话
· 自然语言理解(natural language comprehension): 用计算机对人类传达的信息做出合理的解释
· 语音合成(voice synthesis): 用计算机制造出人类的语音
A. 语音合成
两种解决方案 : 动态语音生成和录制语音
1. 动态语音生成
计算机分析构成单词的字母,生成这些字母对应的声音序列
人类的语音可以被划分成特定的声音单元 ———— 音素
音素(phonemes): 任何指定的语言中的基本声音单元的集合
选中合适的音素后,计算机将根据使用这个音素的上下文修改它的音调。此外还要确定每个音素的
持续时间,最后,计算机要把所有音素组合在一起形成独立的单词。声音本身是通过电子方式生成的,
模拟人类声带的发声方式。
2. 语音合成方式
实现对人声进行数字录制。语句是把单词按照适当的顺序排列得到。
它有真实的人声,但是它的词汇量只限制于预先录制好的单词,只有单词量少的时候才会使用。
B. 语音识别
当训练语音系统来识别特定的人声和单词集合后,语音识别取得了更大的进展。
语音可以被录制为声纹波,绘制了讲特定单词时声音频率的变化2
训练语音识别系统时,由一个人多次重复一个单词,是计算机记录下这个人对这个单词发音的平均声纹波
此后,将用所讲的单词与记录的声纹波进行比较,以确定这个单词是什么
没有经过特定声音和单词训练的语音识别系统将与通用的声纹波比较以识别单词。
声纹波(voiceprint): 表示人声随着时间推移的频率变化的图
C. 自然语言理解
即使计算机能够识别人们所讲的单词,要理解这些单词的意思是自然语言处理里最具有挑战性的方面
这是因为自然语言具有二义性:
词法二义性(lexical ambiguity): 由于单词具有多种含义而照成的二义性
句法二义性(syntactic ambiguity): 由于句子的构造方式有多种而照成的二义性
指代二义性(referential ambiguity): 由于代词可以指代多个对象而照成的二义性
13.6 机器人学
分为两类 -- 固定机器人和可移动机器人
固定机器人多在固定的装配线上,应用于工业工程的领域。
而可移动机器人的世界建模需要使用人工智能的技术
A. 感知——规划——执行范型(sense-plan-act,SPA)
步骤:
感知 --> 世界建模 --> 规划 --> 控制 --> 执行
B. 包孕体系结构
是一种新的范型,它不再模拟整个机器人世界,而是赋予机器人一套简单的行为,每种行为与它
所必需的一部分机器人世界相关联在一起。除非这些行为有冲突,否则可以并行运行。
在有冲突的情况下,每种行为傲达到目标的顺序决定了下一条要执行的是什么行为。
这种体系结构的名字源于行为的目标是可以排序的,或者说一种行为的目标包含在另一种行为目标中。
另一种转变是把机器人世界看作统一的坐标格,每个单元格表示等量的真实空间,整个世界是一个拓扑地图。
拓扑地图把就把空间看作一幅由弧连接的地图点,具有相近和顺序的概念,但没有距离的概念。
机器人的三条定律:
按关键序:
1. 机器人不可以伤害人类或对人类受伤害置之不理
2. 机器人必须服从人类的指令
3. 机器人必须保护自己的存在
C. 物理部件
机器人是有传感器、执行器和计算部件(一个微处理器)构成的。
传感器负责收集周围的数据,执行器负责移动机器人,计算部件负责给执行器发送指令。
机器人常用的三种移动设备: 轮子、履带、机械腿