Series格式和ndarray格式中，提取特定的一列数据

最新推荐文章于 2023-06-07 08:36:14 发布

popo-shuyaosong

最新推荐文章于 2023-06-07 08:36:14 发布

阅读量1.2w

点赞数 2

分类专栏：随笔（问题处理）文章标签：数据分析 DataFrame Series ndarray 提取特定的一列数据

本文链接：https://blog.csdn.net/weixin_41577426/article/details/103832613

版权

本文介绍了如何在数据分析中，从Series和ndarray格式的数据集中提取特定列。以鸢尾花数据集为例，展示了如何通过布尔索引在Series中获取特定标签的数据，以及在ndarray中提取指定列的方法。同时，文章提供了数据集的图表展示，以辅助理解数据的分布和特征。

摘要由CSDN通过智能技术生成

本文使用的数据集是鸢尾花，代码写在jupy notebook中。
数据集内包含 3 类共 150 条记录，每类各 50 个数据，每条记录都有 4 项特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度，可以通过这4个特征预测鸢尾花卉属于（iris-setosa, iris-versicolour, iris-virginica）中的哪一品种。

读取数据

人为的给数据集添加特征名，names = [‘sepal_len’, ‘sepal_wid’, ‘petal_len’, ‘petal_wid’, ‘class’]

import numpy as np
import pandas as pd

df = pd.read_csv('iris.data', header = None, names = ['sepal_len', 'sepal_wid', 'petal_len', 'petal_wid', 'class']) 
print(df.shape)
df.head()