使用scikit-learn的数据集

你是否还在为机器学习没有经典的数据集苦苦寻找?本文将为你介绍scikit-learn中的数据集及基本用法。
导入机器学习常用库numpy和matplot:
在这里插入图片描述
sklearn有很多数据集,我们先导入scikit-learn的数据集库,再导入鸢尾花数据集:
在这里插入图片描述
查看数据集里面有什么key,并且查看desc鸢尾花数据集的描述:
在这里插入图片描述
查看鸢尾花具体数据
在这里插入图片描述
查看数据集的shape和特征:
在这里插入图片描述
取分类结果数据:
在这里插入图片描述
所以我们可以看到,结果分三类,在数据里面表示为0、1、2,一共有150个样本。再结合上面的shape和特征,我们可以知道每个样本都有4个特征。
让我们开始使用数据,先通过fancy index的方式取前两个特征:
在这里插入图片描述
取两个特征的数据画散点图上:
在这里插入图片描述
把样本结果导入,并且取结果为0的数据,分别与0和1组合:
在这里插入图片描述
X[y==0,0]表示取样本结果为0的X的第一个特征;
X[y==0,1]表示取样本结果为0的X的第二个特征;
将不同的样本结果(0,1,2)的第一个特征和第二个特征分别绘制在散点图x轴y轴上,分别用不同的颜色和标记:
在这里插入图片描述
关于marker可以查看这里去了解更多
可以看到,2结果和3结果区分不是很清楚。
之前用的是第一个和第二个特征区分,我们可以用后面的两个第三第四特征区分,这样就比较清晰了:
在这里插入图片描述
其他的数据集,大家可以自行到scikit-learn的官网查看

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值