Pandas的query函数——Python数据分析系列

人工智能交流Q群:953882093 有问题可直接问群内大佬
Pandas 可以说是 在Python数据科学领域应用最为广泛的工具之一。

Pandas是一种高效的数据处理库,它以 dataframe 和 series 为基本数据类型,呈现出类似excel的二维数据。
在数据处理过程中经常会用到数据筛选,Pandas 中提供了数据筛选的多种方法,这里给大家分享下 在Pandas中应用 query 函数来进行数据筛选。

query 函数的一般用法如下:

df.query('expression')

文中的代码是在 Jupyter Notebook 中运行的(也可以是其他IDE),本次使用的 Pandas 版本是 1.3.0 版,如下:

import pandas as pd
 
 
print(f'pandas version: {pd.__version__}')
 
# pandas version: 1.3.0rc1

在开始之前,先创建一份数据,供后续使用:

data = {
    'brand':['Python数据之道','价值前瞻','菜鸟数据之道','Python','Java'],
    'A':[10,2,5,20,16],
    'B':[4,6,8,12,10],
    'C':[8,12,18,8,2],
    'D':[6,18,14,6,12],
    'till years':[4,1,1,30,30]
}
 
df = pd.DataFrame(data=data)
df

数据如下:
在这里插入图片描述
常用方法
筛选 “brand” 列中值为 “Python数据之道” 的行,如下:

df.query('brand == "Python数据之道"')

结果如下:
在这里插入图片描述
说明一下,上面代码中的单引号和双引号是可以互换的,下面的写法,其结果也是一样的:

df.query(" brand == 'Python数据之道' ")

上面用 query 函数筛选数据,用下面的方法也是可以实现的:

df[df['brand']=="Python数据之道"]

在这里插入图片描述
上面是筛选字符串的值,也可以是筛选数字,如下:
在这里插入图片描述
通过数学表达式筛选
除了直接通过等于某个值来筛选, query 函数还支持通过数学表达式来进行数据筛选,包括 >、 <、 +、 -、 *、 / 等。

示例如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
通过变量筛选
在程序比较长的时候,经常会使用变量来作为筛选条件, query 函数在使用变量作为判断标准时,通过在变量前面添加 @ 符号来实现,示例如下:

# 通过变量来筛选数据,在变量前使用 @ 符号即可
 
name = 'Python数据之道'
 
df.query('brand == @name')

在这里插入图片描述
列表数据筛选
当需要在某列中筛选多个符合要求的值的时候,可以通过列表(list)来实现,示例如下:

# 需要注意下 双引号 和 单引号的分开使用
 
df.query('brand in ["Python数据之道","价值前瞻"]')
# df.query("brand in ['Python数据之道','价值前瞻']")

在这里插入图片描述
多条件筛选
有很多情况下,咱们需要通过多个条件来筛选数据,query 函数支持多种条件的组合,

两者都需要满足的并列条件使用符号 &,或 单词 and

只需要满足其中之一的条件使用符号 |,或 单词 or

示例如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
列名称有空格的情况
当 dataframe 的列名称中有空格或其他特殊符号的时候,需要使用 反引号(backtick mark),即键盘ESC键下面的按键(就是键盘上第二排第一个按键,有‘~’这个符号的按键) 来将列名包裹起来,示例如下:

df.query("`till years` < 5")

在这里插入图片描述
注意,如果使用单引号,将会报错,如下:
在这里插入图片描述
筛选后选取数据列
在数据筛选后,还可以选择需要的数据列,如下:
在这里插入图片描述
小结
以上就是关于 Pandas 中 query 函数的主要内容介绍,应用 query函数进行数据筛选,其语言还是比较简洁的,尤其是当条件比较多的时候,会显得更优雅。

比如下面的对比,假设都是三个筛选条件(假设数据量较多,符合的结果也较多):

没有使用query函数时

df[(df['brand']=="Python数据之道") & (df['A'] >2) & (df['C'] >4)]

在这里插入图片描述
可以看出上面的表达式是比较长的,略显繁琐。

使用query函数时

df.query(" brand == 'Python数据之道' & A>2 & C>4 ")

在这里插入图片描述
相对来说,使用query 函数会显得更加简洁,如果觉得这个功能不错,就赶紧用起来吧~~
需要资源包欢迎扫下方二维码
在这里插入图片描述
在这里插入图片描述

  • 27
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
Python数据分析函数用法大全比较难以一次性全部列出,因为Python数据分析所使用到的函数非常多。但是,我可以列出一些常用的Python数据分析函数及其用法,帮助你更好地理解数据分析。 1. Pandas库中的常用函数 Pandas库是Python数据分析中常用的库之一,以下是一些常用的函数: - read_csv:读取CSV文件; - read_excel:读取Excel文件; - read_sql_query:执行SQL查询,并将结果读取到DataFrame中; - concat:将两个或多个DataFrame按行或列进行合并; - merge:将两个或多个DataFrame按照某一列进行合并; - groupby:按照某一列进行分组; - pivot_table:根据指定的行和列进行数据透视; - apply:对DataFrame中的每行或每列进行函数操作; - value_counts:计算Series中每个值出现的次数; - drop_duplicates:删除DataFrame中的重复行; - fillna:填充缺失值; - isnull:检查DataFrame中的缺失值; - plot:绘制图表。 2. Numpy库中的常用函数 Numpy库是Python数据分析中常用的库之一,以下是一些常用的函数: - arange:生成等差数列; - linspace:生成等间隔数列; - random:生成随机数; - reshape:改变数组形状; - concatenate:将两个或多个数组按行或列进行合并; - max:计算数组的最大值; - min:计算数组的最小值; - mean:计算数组的平均值; - sum:计算数组的总和; - argmax:返回数组中最大值的索引; - argmin:返回数组中最小值的索引; - dot:计算矩阵乘积。 3. Matplotlib库中的常用函数 Matplotlib库是Python数据分析中常用的可视化库之一,以下是一些常用的函数: - plot:绘制线图; - scatter:绘制散点图; - hist:绘制直方图; - bar:绘制柱状图; - pie:绘制饼图; - boxplot:绘制箱线图。 4. Seaborn库中的常用函数 Seaborn库是Python数据分析中常用的可视化库之一,以下是一些常用的函数: - distplot:绘制直方图和密度曲线; - pairplot:绘制多个变量之间的关系图; - heatmap:绘制热力图; - lmplot:绘制线性回归模型图; - boxplot:绘制箱线图。 以上是Python数据分析中常用的一些函数及其用法,但仅仅列出这些是远远不够的,因为Python数据分析所使用到的函数非常多,需要在实践中不断学习和积累。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能小雨老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值