#####
from sklearn.datasets import load_iris #在sklearn自带的数据集中导入鸢尾花load_iris数据集
data=load_iris() #鸢尾花数据集赋值给data
print(data) #输出数据
运行结果1:
type(data) #查看数据类型
运行结果2:
data.keys()
print(data.data[0])
print(data.data.shape) #确定数据集大小
print(data.target)
运行结果3:
data_feature=data.feature_names
print(data_feature)
iris_data=data.data
print(iris_data) #查看鸢尾花特征
运行结果4:
data_target=data.target_names
print(data_target)
iris_data=data.target #鸢尾花的类别
运行结果5:
type(iris_data) #查看数据类型
运行结果6:
import numpy
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length) #取出花萼长度的数据
运行结果7:
petal_length=numpy.array(list(len[2]for len in data['data']))
print(petal_length)#取出花瓣长度数据
运行结果8:
petal_width=numpy.array(list(len[3]for len in data['data']))
print(petal_width)#取出花瓣宽度数据
运行结果9:
print(data.data[1])
print(data.target_names[1])#取出某朵花的四个特征及类别
运行结果10:
setosa_data = []
versicolor_data = []
virginica_data = [] #将所有花的特征和类别分成三组,每组50个
for i in range(0,150):
if data.target[i] == 0:
data1 = data.data[i].tolist()
data1.append('setosa')
setosa_data.append(data1)#生成setosa类的鸢尾花数据
elif data.target[i] == 1:
data1 = data.data[i].tolist()
data1.append('versicolor')
versicolor_data.append(data1)#生成versicolor类的鸢尾花数据
else:
data1 = data.data[i].tolist()
data1.append('virginica')
virginica_data.append(data1)#生成virginica类的鸢尾花数据类型
newdata=(setosa_data,versicolor_data,virginica_data)
print(newdata)#生成新的数组,每个元素包含四个特征+类别
运行结果11: