sklearn.datasets常用API介绍

最新推荐文章于 2024-07-16 17:02:33 发布

fengzhizi76506

最新推荐文章于 2024-07-16 17:02:33 发布

阅读量1k

点赞数

分类专栏： sklearn常用API介绍

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengzhizi76506/article/details/79639585

版权

本文将深入探讨scikit-learn库中的datasets模块，包括常见数据集的加载、数据预处理及如何利用这些数据集进行机器学习模型训练。通过对iris、digits等经典数据集的实例解析，帮助读者理解其用法。

摘要由CSDN通过智能技术生成

sklearn.datasets
返回元组(X,y),X是n_samples*n_features的矩阵表示样本特征,y是n_samples*1的矩阵表示标签
含有属性data为X，target是y
含有属性DESCR包含feature_names和target_names,表示数据集的详细描述.

load_boston([return_X_y]) 返回波士顿房价数据集，回归问题
return_X_y：默认为False，为True时返回元组(data,target)

load_iris([return_X_y])返回鸢尾花数据集，分类问题

load_diabetes([return_X_y])返回糖尿病数据集，回归问题

load_digits([return_X_y])返回数字识别数据集，分类

load_breast_cancer([return_X_y])返回乳癌的数据集，分类问题

sklearn.datasets.fetch_olivetti_faces(data_home=None,shuffle=False,random_state=0,download_if_missing=True)
此数据集包括40个不同的人每人取10张照片，照片表示为8bit的整数，灰度值为0-256，加载时会将灰度值转化为[0,1]内方便很多算法处理
每张照片表示为64*64像素

data_home:选择数据集的文件，默认为'../scikit_learn_data'

shuffle:boolean,如果为True则每次选择图片时打乱顺序，避免选择同一个人的图片

random_state:参数为int,RandomState instance or None.用来设置生成随机数的方式

int:作为随机数生成器的种子
RandomState instance:作为随机数生成器
None:随机数生成器采用np.random

download_if_missing:boolean,默认为True
如果为False，下载数据失败后生成IOError，而不是从源网站继续下载

（上述参数为每个函数都具有的通用参数，下面不再赘述ÿ

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
sklearn.datasets常用API介绍

sklearn.datasets返回元组(X,y),X是n_samples*n_features的矩阵表示样本特征,y是n_samples*1的矩阵表示标签含有属性data为X，target是y含有属性DESCR包含feature_names和target_names,表示数据集的详细描述.load_boston([return_X_y]) 返回波士顿房价数据集，回归问题return_X_y：默认...
复制链接

扫一扫

专栏目录

fengzhizi76506 CSDN认证博客专家 CSDN认证企业博客

码龄8年

113: 原创

53万+: 周排名

202万+: 总排名

34万+: 访问

: 等级

3650: 积分

43: 粉丝

160: 获赞

26: 评论

235: 收藏

私信

关注

热门文章

分类专栏

最新评论

python3的爬虫算法（1）--获取网页数据
Tisfy: 此贴甚妙！
python3的urlretrieve使用方法
GH____: 明明是python2的
c++容器queue的用法整理
WINKYOU: 很不错，对小白很善良，谢谢
同时安装python2和python3的pip使用问题
m0_37798296: 我也遇到楼主的问题，尝试了只保留环境变量中的C:\Users\Bob\AppData\Local\Programs\Python\Python37\Scripts\（此路径在cmd执行时用来找pip.exe），而将python2的pip路径删除。
simpson积分公式
WLHW 回复 Jerry-hao: 不过有些题目中的f（x）是已经给出的，y1，y2，y3，要根据f（x）算出

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。