sklearn数据集操作2

在这里插入图片描述
可在线下载(Downloadable)的数据集
sklearn.datasets.fetch_

在这里插入图片描述
20类新闻文本数据集:
该数据集包含了关于20个话题(topic)的18000条新闻报道,这些数据被分为两个子集:训练集和测试集。
在这里插入图片描述
在这里插入图片描述
20组新闻文本数据集API用法详解
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
野外带标记人脸数据集:fetch_lfw_people()
fetch_lfw_pairs()

这是一个在互联网上收集的带标记的著名人物人脸集合,以Jpeg格式存储,官方网址:https//vis-www.cs.umass.edu/lfw/。每一张图片都包含一个居中对齐的人脸。典型的任务是”人脸验证face verification“:给两张图片,用二元分类器来判断是否是同一个人。

”人脸识别face recognition or identification“:给一张未知的人脸图片,在人脸库里面查找匹配,将这张脸到底是谁给认出来。

不管是人脸识别还是人脸验证,他们都依赖于一个人脸检测算法。所以,LFW中的人脸都是用一个人脸检测算法Viola-Jones在不同的web图像集里面检测并扣取出来的。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Olivetti人脸数据集:fetch_olivetti_faces()
在这里插入图片描述
在这里插入图片描述
rcv1多标签数据集:fetch_rcv1()
在这里插入图片描述
还有其他的属性如sample_id,target_names等

Forest covertypes:预测森林表面植被类型的数据集,是个多类分类任务数据集。来自美国的森林数据,UCI数据集。

每个样本包含54个特征,其中含有布尔类型的特征。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
计算机生成的数据集
sklearn.datasets.make_

在这里插入图片描述
用于分类任务和聚类任务的:这些函数产生样本特征向量矩阵以及对应的类别标签集合
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用于回归任务的
在这里插入图片描述
用于流行学习的
在这里插入图片描述
用于因子分解的
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值