数据的划分与转换器和预估器
数据集的划分
训练集
用于训练,构建模型。
测试集
在模型检测时使用,用于评估模型是否有效。
sklearn数据集接口介绍
数据集划分API sklearn.model_selection.train_test_split
-
sklearn.datasets
- 加载获取流行数据集 - datasets.load_*() - 获取小规模数据集,数据包含在datasets里 - datasets.fetch_*(data_home=None) - 获取大规模数据,需要从网络上下载
获取数据集返回的类型:
sklearn分类数据集
sklearn.datasets.load_iris()
加载并返回鸢尾花的数据集
sklearn.datasets.load_digits()
加载并返回数字数据集
from sklearn.datasets import load_iris
li=load_iris()
print("获取特征值")
print(li.data)
print("目标值")
print(li