Pandas---条件筛选与组合筛选

Pandas—条件筛选与组合筛选

在使用pandas进行数据分析时,经常需要根据逻辑条件来筛选数据。
如果使用 for循环语句 遍历的方式来查找,将十分耗时。
推荐使用pandas自身的功能函数进行筛选,效率更高。
以下列出笔者常用的筛选方法。

条件筛选

根据具体值筛选

df[df['Num'] == 10]
df[df['Name'] == 'Tom']

找出df中值在具体列表中的数据

val_list = [100, 200, 300]
df[df['Num'].isin(val_list)]

筛选某列值长度为固定值的数据

df[df['content'].str.len() == 10]

筛选某列是否为空的数据

# 找出content列为空的数据
df[df['content'].isna()]

# 找出content不为空的数据
df[~df['content'].isna()]

组合筛选

多条件同时满足

# 找出df中A列值为100B列值为‘a’的所有数据
df[(df['A']==100)&(df['B']=='a')]

多条件满足其一即可

# 找出df中A列值为100B列值为‘b’的所有数据
df[(df['A']==100)|(df['B']=='b')]

注:筛选后所得数据的索引一般是乱的,可使用 df = df.reset_index(drop=True) 的方式重置索引。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值