numpy数据集练习(运用jupyter notebook)
1. 导入scipy,numpy,sklearn包
import scipy#加载scipy包 import numpy#加载numpy包 from sklearn.datasets import load_iris #加载sklearn包
2. 从sklearn包自带的数据集中读出鸢尾花数据集data
3.查看data类型,包含哪些数据
from sklearn.datasets import load_iris #读出鸢尾花数据集data data=load_iris()#查看data类型 print(type(data))#查看数据内容 print(data.keys())
运行结果:
4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
#鸢尾花的4个特征 data_feature= data.feature_names iris_data=data.data print(data_feature) print(iris_data) #鸢尾花的3个类别 data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #数据类型 type(iris_data)
运行结果:
5.取出所有花的花萼长度(cm)的数据
#鸢尾花花萼长度的数据 sepal_length=numpy.array(list(len[0] for len in data['data'])) print(sepal_length)#输出结果
运行结果:
6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
#鸢尾花花瓣长度的数据 petal_length=numpy.array(list(len[2] for len in data['data'])) print(petal_length) #鸢尾花花瓣宽度的数据 petal_width=numpy.array(list(len[3] for len in data['data'])) print(petal_width)
运行结果:
7.取出某朵花的四个特征及其类别。
#取出某朵花的4个特征 print(data.data[2]) #取出某朵花的类别 print(data.target_names[2])
运行结果:
8.将所有花的特征和类别分成三组,每组50个
9.生成新的数组,每个元素包含四个特征+类别
#定义三个列表来存放不同类型花朵的类别 setosa_data = [] versicolor_data = [] virginica_data = [] # for i in range(0,150): #生成为setosa类的鸢尾花花数据 if data.target[i] == 0: data1 = data.data[i].tolist() data1.append('setosa') setosa_data.append(data1) #生成为versicolor类的鸢尾花数据 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append('versicolor') versicolor_data.append(data1) #剩下的为virginica类的鸢尾花数据 else: data1 = data.data[i].tolist() data1.append('virginica') virginica_data.append(data1)
#生成新的数组,每个元素包含四个特征+类别 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)
运行结果: