1.训练集(training set/data)/训练样例(training examples):用来进行训练,也是产生模型或者算法的数据集
测试集(testing set/data)/测试样例(testing examples):用来专门进行测试已经学习好的模型或者算法数据集
特征向量(features / feature vector):属性集合,通常用一个向量来表示,附属于一个实例
标记(label):c(x) , 实例类别的标记
正例(positive example)
反例(negative example)
2. 分类(classification):目标标记为类别型数据
回归(regression):目标标记为连续性数值
3.有监督学习(supervised learning):训练集有类别标记(class label)
无监督学习(unsupervised learning):无类别标记
半监督学习(semi-supervised learning):有类别标记的训练集+无标记的训练集
4.机器学习步骤框架
(1)把数据拆分成训练数据和测试数据
(2)用训练集和训练集的特征向量来训练算法
(3)用学习来的算法运用在测试集上评估算法(涉及调整参数 parameter tuning)
————————————————
版权声明:本文为CSDN博主「lihuaqinqwe」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lihuaqinqwe/article/details/80549144