一、sklearn数据集与估计器:
(一)数据集的划分:
①训练数据集(75%):用于训练,通过算法构建模型
②测试数据集(25%):对于模型的检验与评估
(二)API:
sklearn.model_selection.train_test_split
(三)scikit-learn数据集API介绍
(1)分类的数据集
sklearn.
datasets
加载获取流行数据集
datasets.load
_*()
获取小规模数据集,数据包含在
datasets
里
datasets.fetch
_*(
data_home
=None)
获取大规模数据集,需要从网络上下载,函