机器学习(一) 基于sklearn库的数据集划分(交叉验证)
机器学习中首要环节就是数据集的处理,其中数据集的处理从个人理解(如有错误敬请谅解)的角度来说包括两个方面:数据集划分和数据清理。其中数据集划分是指训练集、验证集和测试集的数据类别划分;数据清理是指数据的清洗、删除等等方面。这两天主要学的就是如何划分数据集。
一、数据集划分(交叉验证)
划分数据集的目的主要是为了后期训练模型参数的准确性以及测试结果的准确性,避免下列问题:
1.训练集和测试集分...
原创
2019-11-06 14:09:53 ·
3360 阅读 ·
0 评论