数据集信息
import matplotlib.pyplot as plt
import sklearn.datasets as dataset
iris_data=dataset.load_iris()
print(type(iris_data))#sklearn自定义的一种数据类型,类似字典
print(iris_data.keys())#打印所有的key
print('iris data:',type(iris_data.data),'shape:',iris_data.data.shape)#(150,4)的矩阵
print('feature name:',iris_data.feature_names)
print('iris target:',type(iris_data.target),'shape:',iris_data.target.shape)#(150,)的向量
print('target name:',iris_data.target_names)
iris_data.data#特征
iris_data.target#标签
对鸢尾花数据集中的前两个标签进行散点图绘制
data=iris_data.data
target=iris_data.target
plt.scatter(data[:,0],data[:,1])#使用前两个特征绘制散点图
plt.show()
不同类别使用不用颜色
target==2#通过判断获取对应类别索引
data[target==2,0]#类别为2的数据
for i in range(3):
plt.scatter(data[target==i,0],data[target==i,1])#fancy indexing的方式取对应标签的样本
plt.show()
此时单从前两个特征不容易区分类别1和类别2,此时可以用后两个类别可视化试试。
可视化后两个类别
plt.scatter(data[target==0,2],data[target==0,3],color='blue',marker='o')
plt.scatter(data[target==1,2],data[target==1,3],color='orange',marker='+')
plt.scatter(data[target==2,2],data[target==2,3],color='green',marker='+')
plt.show()