一:读取数据
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
iris = datasets.load_iris()
print(type(iris))
#<class 'sklearn.utils.Bunch'> 和字典类型一样
print(iris.keys())
#包括5个key,dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])
#分别打印下
print(iris.data)#打印数据
print(iris.target)#打印最后的标记,包括0,1,2
print(iris.target_names)#打印最后的特征值的名称
print(iris.DESCR)#打印描述信息
print(iris.feature_names)#打印样本的特征名称
二:数据探索
data = iris.data
x = data[:,:2] #取前两列
plt.scatter(x[:,0],x[:,1])
plt.show()
#查看下每种花鄂片的分布情况
target = iris.target
plt.scatter(x[target==0,0],x[target==0,1])
plt.scatter(x[target==1,0],x[target==1,1])
plt.scatter(x[target==2,0],x[target==2,1])
plt.show()
#查看下每种花的花瓣分布情况
x = data[:,2:]
plt.scatter(x[target==0,0],x[target==0,1])
plt.scatter(x[target==1,0],x[target==1,1])
plt.scatter(x[target==2,0],x[target==2,1])
plt.show()