总结一下利用pandas进行条件筛选的几个方法

首先创建一个表:

df = pd.DataFrame({'A':[100, 100, 200, 300, 400], 
                   'B':['a', 'a', 'c', 'd', 'e'],
                   'C':[3, 2, 1, 5, 4]})

生成出来的表如下所示:

 

1)找出df中A列值为100的所有数据

df[df.A==100]

 

这里也可以是小于(<)、大于(>)、小于等于(<=)、大于等于(>=)、不等于(!=)等情况。

2) 找出df中A列值为100、200、300的所有数据

num = [100, 200, 300]
df[df.A.isin(num)]

 

3) 找出df中A列值为100且B列值为‘a’的所有数据

df[(df.A==200)&(df.B=='c')]

 

4)找出df中A列值为100或B列值为‘b’的所有数据

df[(df.A==100)|(df.B=='b')]

 

这里需要注意的是,多条件筛选的时候,必须加括号'()'。 

5) 需要删除B列的重复行,同时保留重复行中C列最大值所在的行

df.sort_values("C", ascending=False).drop_duplicates("B", keep='first').reset_index(drop=True)

可以看到,B列数据只有一个‘a’数据了,这句代码的意思是先对C列进行降序排序,然后删除B列重复的数据,keep参数是只保留第一个,因为是降序排序,第一个B列的C列数据相对于其他重复的C列数据是最大的(有点绕口) 

参考:

利用pandas进行条件筛选和组合筛选 - beyondChan - 博客园

Python Pandas 删除某列重复值,同时根据另一列数值选取保留行_liangbilin的博客-CSDN博客

  • 14
    点赞
  • 134
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值