训练数据集(training data set)或训练集(training set):
想要开发一个具有一定功能的模型,必须要有大量的相关事例作为数据集,这些事例就是训练集。有了这一些事例,就可以根据自变量和因变量之间的关系来作为模型预测的依据。
样本(sample):
每组数据就是样本,也可以称为数据点(data point)或数据样本(data instance)。
标签(label)或目标(target):试图预测的目标。
特征(feature)或协变量(covariate):预测所依据的自变量。