1.1 引言
机器学习就是通过计算的手段,从已有数据集中产生模型,而这个模型就可以用于对新的情况进行处理。
1.2 基本术语
数据集、样本/示例、属性/特征、属性值、属性空间/样本空间/输入空间、特征向量,样本的维数(即它包含多少个属性)
标记:有关示例结果的信息,拥有标记信息的示例称为样例,样例张成的空间称为标记空间或者输出空间。
学习任务:分类(预测的是离散值、有监督学习)、回归(预测的结果是连续值、有监督学习)、聚类(无监督学习),没有标记的就是无监督学习。
泛华能力:学得模型适用于新样本的能力。
1.3 假设空间
假设的表示一旦确定,假设空间的大小以及规模大小就确定了。
1.4 归纳偏好:机器学习算法在学习过程中对某种类型假设的偏好
奥卡姆剃刀原则:选简单的
没有免费的午餐原则:其实都一样!