pandas学习手记-筛选,过滤

首先还是准备一张练习的源数据表。
在这里插入图片描述

import pandas as pd

excel_path = r'E://temp/raw.xlsx'
# 读取一个excel文件为DataFrame,并设置索引为id这一列
df = pd.read_excel(excel_path, index_col='id')

# 定义两个函数创建筛选条件
def age_20_to_30(a):
    return 20<=a<30

def level_score(s):
    return 80<=s<100
# 分别将每列的数据传入指定函数中筛选一遍
df = df.loc[df['age'].apply(age_20_to_30)].loc[df['score'].apply(level_score)]
print(df)

在这里插入图片描述
loc[Series.apply(function)] 函数可以把DataFrame指定列那个Series的每个数据挨个传入函数中筛选,可以同时在后面点多个筛选条件。

取Series

前面说了每一个excel在pandas中取出来得到的是一个DataFraem对象。可以通过键取值df['age']
也可以像对象一样通过点属性的方式取df.age, 得到的结果是一样的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值