机器学习基础概念
数据挖掘的核心
建模是指利用模型学习已知结果的数据集中的变量特征,通过一系列方法提高模型的学习能力,最终对一些结果未知的数据集输出相应的结果.
可以表达成 y=f(x) 其中x代表样本的特征, y是输出的结果
数据集分类
训练集、验证集、测试集
训练集: 结果已知,用于模型训练拟合的数据样本, 占总体的70%~80%
验证集:结果已知,不参与模型训练的拟合过程, 用于验证已经训练过的模型效果.同时对模型中的超参数进行选择
测试集:结果未知,测试机器训练结果的准确性,或是利用模型输出结果..
原创
2020-12-12 17:04:15 ·
1342 阅读 ·
3 评论