sklean中鸢尾花数据集可视化

von Libniz

已于 2022-01-31 11:23:45 修改

阅读量2.1k

点赞数 4

于 2022-01-30 16:18:12 首次发布

本文链接：https://blog.csdn.net/Demon_LMMan/article/details/122753605

版权

机器学习专栏收录该内容

20 篇文章 2 订阅

订阅专栏

数据集信息

import matplotlib.pyplot as plt
import sklearn.datasets as dataset

iris_data=dataset.load_iris()
print(type(iris_data))#sklearn自定义的一种数据类型，类似字典
print(iris_data.keys())#打印所有的key

在这里插入图片描述

print('iris data:',type(iris_data.data),'shape:',iris_data.data.shape)#(150,4)的矩阵
print('feature name:',iris_data.feature_names)
print('iris target:',type(iris_data.target),'shape:',iris_data.target.shape)#(150,)的向量
print('target name:',iris_data.target_names)

在这里插入图片描述

iris_data.data#特征

在这里插入图片描述

iris_data.target#标签

在这里插入图片描述

对鸢尾花数据集中的前两个标签进行散点图绘制

data=iris_data.data
target=iris_data.target
plt.scatter(data[:,0],data[:,1])#使用前两个特征绘制散点图
plt.show()

在这里插入图片描述

不同类别使用不用颜色

target==2#通过判断获取对应类别索引

在这里插入图片描述

data[target==2,0]#类别为2的数据

在这里插入图片描述

for i in range(3):
    plt.scatter(data[target==i,0],data[target==i,1])#fancy indexing的方式取对应标签的样本
plt.show()

在这里插入图片描述
此时单从前两个特征不容易区分类别1和类别2，此时可以用后两个类别可视化试试。

可视化后两个类别

plt.scatter(data[target==0,2],data[target==0,3],color='blue',marker='o')
plt.scatter(data[target==1,2],data[target==1,3],color='orange',marker='+')
plt.scatter(data[target==2,2],data[target==2,3],color='green',marker='+')
plt.show()