记录:
数据集
示例 / 样本 / 特征向量:
属性 / 特征
属性空间 / 样本空间 / 输入空间:
学习 / 训练:从数据学的模型的过程。
训练数据:训练过程中使用的数据。
训练样本:训练数据中的每个样本。
假设:对应了关于数据的某种潜在规律的模型。
标记:
样例:拥有了标记信息的示例。 ( x i , y i ) (x_i, y_i) (xi,yi)表示第 i i i个样例。
标记空间 / 输出空间
训练集
学习器:模型。
分类:欲预测结果为离散值的学习任务。
正类
负类
回归:欲预测结果为连续值的学习任务。
测试:学得模型后,使用其进行预测得过程。
测试样本:被预测得样本。
聚类:将训练集中的西瓜分成若干组的过程。
簇:指被分成的每个组。
监督学习:代表为分类和回归。
无监督学习:代表为聚类。
泛化能力:通过无监督学习得到的模型适用于新样本的能力。