【Python系列专栏】第七十篇 Python中 Pandas 索引和选择数据

最新推荐文章于 2022-02-27 18:25:39 发布

Mrrunsen

最新推荐文章于 2022-02-27 18:25:39 发布

阅读量176

点赞数

分类专栏： Python 文章标签：列表 python java 机器学习数据分析

本文链接：https://blog.csdn.net/Mrrunsen/article/details/116526932

版权

77 篇文章 9 订阅

订阅专栏

本文详细介绍了如何使用pandas库进行数据筛选，包括简单选择、标签loc、位置iloc、混合选择ix、条件筛选以及索引的修改和重新索引。重点讲解了如何根据标签选择特定行、按位置选择数据，以及利用布尔表达式进行条件过滤。

摘要由CSDN通过智能技术生成

索引的概念有点像SQL的主键，能够通过索引选取一个数据或者一组数据。

pandas的索引对象负责管理轴标签和其他元数据。构建Series或DataFrame时，所用到的任何数组或其他序列的标签都会被转换成一个Index。【index函数可以显示Series的索引】

Series的索引可以通过赋值的方式就地修改；【但是，index对象是不可变的】

index的功能类似一个固定大小的集合，pandas的Index可以包含重复的标签。

【重新索引】：reindex——其作用是创建一个新对象，它的数据符合新的索引。

对于时间序列这样的有序数据，重新索引时可能需要做一些插值处理。method可以达到此目的，例如使用ffill可以实现前向值填充。

obj3.reindex(range(6),method='ffill')

reindex：可以修改行索引和列。只传递一个序列，会重新索引结果的行。列可以用columns关键字重新索引。

在这里插入图片描述

注意：当使用标签字符串进行选取时，会包括首尾两个标签。这点与使用数字序列选取时不同，如下图所示：

用于选取指定行。

采用位置进行选择，在不同情况下所需要的数据例如选某一个，连续选或跨行选等操作。

我们可以采用混合选择 ix, 其中选择’A’和’C’的两列，并选择前三行的数据。

print(df.ix[:3,['A','C']])
"""
            A   C
2013-01-01  0   2
2013-01-02  4   6
2013-01-03  8  10
"""

采用判断指令进行选择，可以约束某项条件然后选择出当前所有数据。

print(df[df.A>8])
"""
             A   B   C   D
2013-01-04  12  13  14  15
2013-01-05  16  17  18  19
2013-01-06  20  21  22  23
"""

丢弃某条轴上的一个或多个项，只要有一个索引数组或列表即可。

drop方法返回的是一个在指定轴上删除了指定值的新对象。

注意：对于DataFrame，可以删除任意轴上的索引值。

1. 用标签序列调用drop会从行标签（axis0）删除值；

 		2. 传递axis=1或axis=‘columns’可以删除列的值。

关注

专栏目录