1、属性张成的空间称为"属性空间" (attribute space) “样本空间” (sample space) 或"输入 空间"。例如我们把"色泽" “根蒂” "敲声"作为三个坐标轴,则它们张成 一个用于描述西瓜的三维空间,每个西瓜都可在这个空间中找到自己的坐标位置。由于空间中的每个点对应一个坐标向量,因此我们也把一个示例称为一个 “特征向量” (feature vector).
2、一般地,用(Xi,Yi) 表示第 个样例 其中执 εy 是示例 Xi 的标记 是所有标记的集合, 亦称"标记空间" (label space)或"输出空间“。
3、二分类
通常令 = {-1 ,+1} {0,1}
- 正类
- 反类
4、多分类
IYI >2,对回归任务, Y=R,R为实数集。
5、监督学习:训练数据有标记信息的学习过程。亦称:有导师学习。
无监督学习:训练数据没有标记信息的学习过程。亦称:无导师学习。
6、机器学习算法在学习过程中对某种假设类型的偏好,称为归纳偏好。
任何一个机器学习算法都必有其归纳偏好,否则将无法产生确定的学习结果