numpy数据集练习(运用jupyter notebook)

numpy数据集练习(运用jupyter notebook)

1. 导入scipy,numpy,sklearn包

import scipy#加载scipy包
import numpy#加载numpy包
from sklearn.datasets import load_iris #加载sklearn包

2. 从sklearn包自带的数据集中读出鸢尾花数据集data

3.查看data类型,包含哪些数据

from sklearn.datasets import load_iris #读出鸢尾花数据集data
data=load_iris()#查看data类型
print(type(data))#查看数据内容
print(data.keys())

运行结果:

4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型

#鸢尾花的4个特征
data_feature= data.feature_names
iris_data=data.data
print(data_feature)
print(iris_data)
#鸢尾花的3个类别
data_target =data.target_names
print(data_target)
iris_data=data.target
print(iris_data)
#数据类型
type(iris_data)

运行结果:

5.取出所有花的花萼长度(cm)的数据

#鸢尾花花萼长度的数据
sepal_length=numpy.array(list(len[0] for len in data['data']))
print(sepal_length)#输出结果

运行结果:

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

#鸢尾花花瓣长度的数据
petal_length=numpy.array(list(len[2] for len in data['data'])) 
print(petal_length)

#鸢尾花花瓣宽度的数据
petal_width=numpy.array(list(len[3] for len in data['data'])) 
print(petal_width)

运行结果:

7.取出某朵花的四个特征及其类别。

#取出某朵花的4个特征
print(data.data[2])
#取出某朵花的类别
print(data.target_names[2])

运行结果:

8.将所有花的特征和类别分成三组,每组50个

9.生成新的数组,每个元素包含四个特征+类别

#定义三个列表来存放不同类型花朵的类别
setosa_data = []
versicolor_data = []
virginica_data = []
#
for i in range(0,150):
    #生成为setosa类的鸢尾花花数据
    if  data.target[i] == 0: 
        data1 = data.data[i].tolist()
        data1.append('setosa')
        setosa_data.append(data1)
    #生成为versicolor类的鸢尾花数据  
    elif data.target[i] == 1: 
        data1 = data.data[i].tolist()
        data1.append('versicolor')
        versicolor_data.append(data1)
    #剩下的为virginica类的鸢尾花数据  
    else:                         
        data1 = data.data[i].tolist()
        data1.append('virginica')
        virginica_data.append(data1)

#生成新的数组,每个元素包含四个特征+类别 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)

运行结果:

 

转载于:https://www.cnblogs.com/Soooooo/p/9790470.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Jupyter Notebook中导入数据集可以通过以下几种方式实现: 1. 使用pandas库导入数据集:首先,确保你已经安装了pandas库。然后,在Jupyter Notebook中创建一个新的代码单元格,使用以下代码导入数据集: ```python import pandas as pd # 读取CSV文件 data = pd.read_csv('path_to_your_dataset.csv') # 显示数据集的前几行 data.head() ``` 在上述代码中,将`path_to_your_dataset.csv`替换为你数据集的实际路径。这将使用pandas库的`read_csv()`函数读取CSV文件,并将数据存储在名为`data`的DataFrame对象中。你可以使用`head()`函数显示数据集的前几行。 2. 使用numpy库导入数据集:如果你的数据集是以文本文件或其他格式存储的,你可以使用numpy库来导入数据。在Jupyter Notebook中创建一个新的代码单元格,使用以下代码导入数据集: ```python import numpy as np # 从文本文件中加载数据集 data = np.loadtxt('path_to_your_dataset.txt') # 显示数据集的形状 print(data.shape) ``` 在上述代码中将`path_to_your_dataset.txt`替换为你数据集实际路径。这将使用numpy库的`loadtxt()`函数从文本文件中加载数据,并将数据存储在名为`data`的numpy数组中。你可以使用`shape`属性来查看数据集的形状。 3. 使用其他相关库导入数据集:除了pandas和numpy,还有其他一些库可以用于导入数据集,如scikit-learn、tensorflow等。具体的导入方法取决于你使用的数据集和库。你可以查阅相关库的文档或搜索相关教程以获取更多详细信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值