- 特征:待学习对象的属性
- 标签:对待学习对象的某一指标的预测
- 样本:标记好特征以及标签的的待学习对象
- 数据集:一组样本构成的集合
- 训练集:用来训练模型的样本集合
- 测试集:用来检验模型好坏的样本集合
- 特征向量:表示一个待学习对象所有特征构成的 D D D维向量 x = ˙ [ x 1 , x 2 , . . . , x D ] T x\dot=[x_1,x_2,...,x_D]^T x=˙[x1,x2,...,xD]T
假设训练集 D D D由 N N N个样本组成,其中每个样本都是独立同分布的,即独立地从相同的数据分布中抽取的,记为
D = ˙ D\dot= D=