sklearn之datasets
sklearn.datasets模块提供了导入、在线下载及本地生成数据集的付费,通过dir或help命令查看:
(1)datasets.load_<dataset_name>() : sklearn自带的小数据集
datasets.load_iris() # 鸢尾花数据集
datasets.load_boston() # 波士顿房价数据集
datasets.load_breast_cancer() # 乳腺癌数据集
datasets.load_diabets() # 糖尿病数据集
datasets.load_digits() # 手写体数字数据集
datasets.load_linnerud() # 手写体数字数据集
这些数据集都可以在官网上查到,以鸢尾花为例,可以在官网上找到demo: http://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html
•
load*
和
fetch*
返回的数据类型
datasets.base.Bunch(
字典格式