scikit-learn学习笔记(2)---Dataset loading utilities

1.通用数据API

scikit-learn提供几种类型的数据集接口,每个数据集都包含一个描述DESCRfeature_namestarget_names
1. Toy datasets;
2. Sample images;

2.Toy datasets

scikit-learn 提供了一些标准的数据集,而不需要额外从网站下载
这个类似字典的对象至少包含两项,键值为datan_samples*n_features 的array;键值为target 的长度为n_samples 的numpy array。
-load_boston([return_X_y]) :下载并返回波士顿房价的数据集,用于回归
-load_iris([return_X_y]) :下载并返回鸢尾花的数据集,用于分类
-load_diabetes([return_X_y]) :下载并返回一个糖尿病的数据集,用于回归
-load_digits([return_X_y]) :下载并返回一个数字的数据集,用于分类
-load_linnerud([return_X_y]) :下载并返回一个linnerud的数据集,用于多元回归
示例1:
这里写图片描述

3.Sample images

scikit 嵌入了一些由创作者共享许可发布的JPEG图像,可用于测试算法和2D数据管道
load_sample_images():
包含以下属性:
-images :两个样本图像;
-filenames :图片的文件名;
-DESCR:对数据集的描述
示例:
这里写图片描述
这里写图片描述
load_sample_images(image_name) :下载单个图像的数据集numpy array
注意:默认的图片编码方式是uint8

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值