文章目录
1.2 机器学习的任务
-
机器学习的一般框架:学习系统根据提供的样本和背景知识,确定特定概念的描述
-
学习算法分为黑箱法(例:神经网络、数学统计)和基于知识方法
1.2.1 认知观点
-
概念:对一组具有共同性质而区别于其他对象的对象的抽象表示
相关概念常常可以组织成树状或图所表示的泛化层次结构
-
与概念有关的三个重要标识:
1.基础水平效果- 基础层次概念通过一些容易识别的特征加以描述,从而使之易被学习
- 例子:鹰——鸟——动物——生物
这个序列中,基础层次概念就是鸟,因为其子概念(鹰、山鸟、鸵鸟……)共享可被传感器检测出的特征(翅膀、羽毛、鸟嘴……)
动物、生物并非基础层次概念,其子概念不共享这些特征
2.典型
两种度量典型性的方法- 与其他子概念共享特征数目
- 从超概念继承特征的数目
特征数目越多,实例越典型
3.上下文相关
1.2.2 表示问题
-
表示语言:描述概念和样本。
- 按照复杂度和表示能力,有:零阶逻辑、属性-值逻辑、Horn子句、二阶逻辑。 若样本为真(被满足),则称一个描述覆盖一个样本
- has_four_legs覆盖一个狮子,但不覆盖一只鹅
1.2.2.1 零阶逻辑(命题演算)
- 利用代表单个特征的布尔常量的合集描述样本和概念
- c <= x ^ y ^ z表示一个对象就是概念的一个实例c,且同时满足x,y,z条件
- 描述能力低级
1.2.2.2 属性逻辑
用事先定义好的以至于属性取值来刻画样本和概念
属性即变量(例:颜色的属性值可以取红、蓝……或者以*表示任意颜色)
样本常常表示成一张表,每行为一个样本,每列为一个属性,上表为吸引年轻企业家的的轿车的正例+和反例-
1.2.2.3 一阶谓词逻辑:Horn子句
Horn子句是一阶逻辑的一个重要子集
-
一个Horn子句包括一个头部和一个主体:
- grandparent(X,Y):-parent(X,Z),parent(Z,Y)
- 上式表示,若可找到Z,使得X是Z的父母,Z是Y的父母,那么X就是Y的祖父母。
- :-左边的值:子句的头部
- :-右边的值:子句的主体
- 逗号表示合取
- “grandparent”称为谓词
- 括号中的变量为参数,参数个数是任意的,但对于给定的谓词是确定的
- 若所有的谓词都只有一个参数,则为属性-值逻辑;都只有0个参数,则为零阶属性
1.2.2.4 二阶谓词逻辑
- 谓词名称本身也可以是变量,一组概念常常共享可能描述的相同结构
- 例:模式p(X,Y):-q(X,XW) ^ q(Y,YW) ^ r(XW,YW)
- 可实例化为:
- brothers(X,Y):-son(X,XW) ^ son(Y,YW) ^ equal(XW,YW)
- lighter(X,Y):-weight(X,XW) ^ weight(Y,YW) ^ less(XW,YW)
- ……
1.2.2.5 明确约束的语言
引入约束,避免逻辑表示语言过分灵活
- 限制谓词数目
- 在谓词参数中排除函数
- 排除递归函数