1.1 基本术语
一条记录是关于一个事件或者对象的描述,称为一个示例(instance)或样本(sample)。
反映事件或对象在某方面的表现或性质的事项,称为属性(attribute)或特征(feature)。
属性的取值称为属性值(attribute value)。
属性张成的空间称为属性空间(attribute space)、样本空间(sample space)或输入空间。
空间中的每个点对应一个坐标向量,一个示例也称为一个特征向量(feature vector)。
从数据中学得模型的过程称为学习(learning)或训练(training)。
学得模型对应了关于数据的某种潜在规律,因此称为假设(hypothesis),潜在规律则称为真相或真实(ground-truth)。
关于示例结果的信息称为标记(lable),拥有了标记信息的示例,则称为样例(example)。
所有标记的集合称为