- 科学推理的两大基本手段:归纳和推理
- 归纳:从特殊到一般的“泛化”过程,即从具体的事实归结出一般性规律
- 演绎:从一般到特殊的“特化”过程,即从基础原理推演出具体状况
数学公理系统中
- 演绎:基于一组公理和推理规则推导出与之相符的定理
- 归纳或归纳学习:从样例中学习
- 广义归纳学习:从样例中学习
- 狭义归纳学习或概念学习或概念形成:从训练数据中学得概念
概念学习技术目前研究、应用都比较少,因为要学得泛化性能好且语义明确的概念实在太困难了,现实常用的技术大多是产生“黑箱”模型。然而,对概念学习有所了解,有助于理解机器学习的一些基础思想
介绍上面的概念是为了:引入布尔概念学习这个概念
- 布尔表达式:
好瓜 ↔ ( 色泽 = ? ) ( 根蒂 = ? ) ( 敲声 = ? ) \text{好瓜}\leftrightarrow \left( \text{色泽}=? \right) \left( \text{根蒂}=? \right) \left( \text{敲声}=? \right) 好瓜↔(色泽=?)(根蒂=?)(敲声=?)
学习的过程就是为了把问号中的内容确定下来,布尔概念学习就是可以用“是”或者“不是”这种可以表示0/1布尔值的目标概念的学习。
假设空间:
形象的表示:布尔表达式中的好瓜对应的问号的取值的集合
例如:色泽有“青绿”、“乌黑”、“浅白”三个值,但可以有四种情况:青绿对应好瓜、乌黑对应好瓜、浅白对应好瓜、好瓜与色泽没有关系,用 * 表示
除了上面的情况外,还有一种比较特殊的情况:好瓜与色泽、根蒂、敲声都无关,用
⊘
\oslash
⊘ 表示
所以如果色泽有3种取值,根蒂有3种取值,敲声有3种取值,则假设空间一共有
4
×
4
×
4
+
1
=
65
4\times 4\times 4+1=65
4×4×4+1=65 种结果
版本空间
假设空间中有多个集合和训练集中的数据相同,我们把这些集合叫做版本空间
下一节:归纳偏好