numpy数据集练习(运用jupyter notebook)

最新推荐文章于 2023-03-10 22:45:09 发布

weixin_30416497

最新推荐文章于 2023-03-10 22:45:09 发布

阅读量535

点赞数

文章标签： python 开发工具数据库

原文链接：http://www.cnblogs.com/Soooooo/p/9790470.html

版权

numpy数据集练习(运用jupyter notebook)

1. 导入scipy，numpy，sklearn包

import scipy#加载scipy包
import numpy#加载numpy包
from sklearn.datasets import load_iris #加载sklearn包

2. 从sklearn包自带的数据集中读出鸢尾花数据集data

3.查看data类型，包含哪些数据

from sklearn.datasets import load_iris #读出鸢尾花数据集data
data=load_iris()#查看data类型
print(type(data))#查看数据内容
print(data.keys())

运行结果：

4.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型

#鸢尾花的4个特征
data_feature= data.feature_names
iris_data=data.data
print(data_feature)
print(iris_data)
#鸢尾花的3个类别
data_target =data.target_names
print(data_target)
iris_data=data.target
print(iris_data)
#数据类型
type(iris_data)

运行结果：

5.取出所有花的花萼长度(cm)的数据

#鸢尾花花萼长度的数据
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length)#输出结果

运行结果：

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

#鸢尾花花瓣长度的数据
petal_length=numpy.array(list(len[2] for len in data['data'])) 
print(petal_length)

#鸢尾花花瓣宽度的数据
petal_width=numpy.array(list(len[3] for len in data['data'])) 
print(petal_width)

运行结果：

7.取出某朵花的四个特征及其类别。

#取出某朵花的4个特征
print(data.data[2])
#取出某朵花的类别
print(data.target_names[2])

运行结果：

8.将所有花的特征和类别分成三组，每组50个

9.生成新的数组，每个元素包含四个特征+类别

#定义三个列表来存放不同类型花朵的类别
setosa_data = []
versicolor_data = []
virginica_data = []
#
for i in range(0,150):
    #生成为setosa类的鸢尾花花数据
    if  data.target[i] == 0: 
        data1 = data.data[i].tolist()
        data1.append('setosa')
        setosa_data.append(data1)
    #生成为versicolor类的鸢尾花数据  
    elif data.target[i] == 1: 
        data1 = data.data[i].tolist()
        data1.append('versicolor')
        versicolor_data.append(data1)
    #剩下的为virginica类的鸢尾花数据  
    else:                         
        data1 = data.data[i].tolist()
        data1.append('virginica')
        virginica_data.append(data1)

#生成新的数组，每个元素包含四个特征+类别
newdata=(setosa_data ,versicolor_data,virginica_data)
print(newdata)