Python：使用pandas对excel数据筛选选择

焊武大帝

已于 2023-07-17 09:20:24 修改

阅读量1.3w

点赞数 8

文章标签： python pandas excel

于 2023-07-14 18:02:47 首次发布

本文链接：https://blog.csdn.net/sunlight_vip/article/details/131729040

版权

1.筛选方式1：直接筛选

#直接筛选
#DataFrame索引使用[],
#直接索引语法:df[]
1.1 直接筛选,选择单列数据：df["列"]

1.2直接筛选,选择多列数据：df[["列1","列2"]](注意:多嵌套列)

1.3直接筛选,选择多行数据：df[2:4]按照位置选取连续的行(切片)，前闭后开

2.筛选方式2：条件筛选

#('----------筛选方式2：条件筛选-------------')
#条件筛选
#布尔索引(带条件判断的索引)：根据布尔条件选择对应的行
#索引列表中可以使用&、|操作符，但是不能用and、or关键词
#布尔选择的结果还是DataFrame,所以对于结果可以进行切片、索引器等访问

2.1:单列布尔选择,df[(df["列"]==条件)]选取某列满足一定条件的行

2.2:多列布尔选择,df[(df["列1"]==条件&df["列1"]>条件)]选取多列满足一定条件的行

3.筛选方式3：筛选器筛选

#在Pandas两种数据结构中，原始索引（位置信息）和自定义索引（标签信息）并存
#原始索引（位置信息）：小标，即行数组0,1,2,3标号;列数组0,1,2,3标号
#自定义索引（标签信息）：小标，即行数组0,1,2,3标号，列名(代码,资产,负债,所有者权益)

#loc索引器：只能使用自定义索引，如果数据中没有自定义索引，则使用原始索引。
#根据行索引和列索引进行选取：先行后列，也可以只选取行索引，
#常见形式如下 1.选择单行/多行数据;
# 2.选择多行多列数据，通过两个列表选取行列组合；
# 3.loc布尔选择，按照条件选取单列(多列)满足一定条件的行；
# 4.loc切片(选择连续的多行多列)，通过切片选取连续的行列组合，冒号前后留空代表开口；

#iloc索引器：iloc索引器与loc索引器使用几乎相同。
#iloc索引器只能使用原始索引(位置信息)，不能使用自定义索引


import pandas as pd

#('----------筛选方式1：直接筛选-------------')
#直接筛选
#DataFrame索引使用[],
#直接索引语法:df[]

df1=pd.read_excel(r'

最低0.47元/天解锁文章