Python Pandas 快速插入列，快速筛选数据：强大到飞起的 eval 和 query 函数

最新推荐文章于 2024-03-21 07:30:00 发布

萝卜

最新推荐文章于 2024-03-21 07:30:00 发布

阅读量1.2k

点赞数

分类专栏： # 数据处理文章标签：数据分析 python pandas 数据预处理经验分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43329700/article/details/104607152

版权

数据处理专栏收录该内容

15 篇文章 6 订阅

订阅专栏

在这里插入图片描述

更多商业数据分析案例(原理，完整代码，数据集)、统计学、SQL、网络爬虫详见公众号 " 数据分析与商业实践 "

引言

在使用 Python 的 Pandas 库处理数据时，我们时常需要添加一些新列，时不时添加一列也就算了，同时添加多列(毫无规律的，不使用循环)时是真的气人，还有就是快速选择符合条件的数据框有时也会成为令人难受。

在这里插入图片描述

业务需求 & 效果实现

快到飞起的 eval()

在这里插入图片描述
笔者将效果实现分成了几个版本

低端累到不能呼吸版
最基础的列操作了
在这里插入图片描述

中端客可喘气版
这个版本借助了循环的帮助，省去了复制粘贴该改数字
在这里插入图片描述
已经快了很多

高端畅顺呼吸版
使用 eval 函数的同时借助循环的帮助，这里就只是展示 eval 的生成单列的用法。
在这里插入图片描述

同样快到飞起的 query()

功能不多说，看图说话即可，只展示 query 最常用的功能
在这里插入图片描述

总结

两个函数的简单和最常见的用法不用说大家看图也能够理解，就是省去了打出文件名和中括号，借助循环的力量，找出列索引的规律；在数据清洗/文件批处理中非常常见。

这两个相对来说冷门一些的函数不仅代码量大大减少，而且在内存执行速度上也会更快；**从版本0.13开始，Pandas 包含了一下实验性的工具允许你直接使用 C 速度操作，避免中间数组的浪费。这些工具是eval()和 query()函数，它们依赖 Numexpr包。**其实这只是这两个函数的冰山一角，各种快捷骚操作还等待着我们去探索 Pandas，Numpy 的快捷函数太多了，所以鲜有人敢自称自己精通 numpy pandas 或者只是其中一个库（熊猫创始人曾在视频中也对此感到无奈）。总的来说，替自己总是忘记快捷函数而感到担忧是完全没有必要的，只需牢记没有最快，只有更快，想得起来就用想不起来就查。

后记

延伸阅读

精彩回顾

Python 实现 RFM 模型(详)：用户行为分析模型，商业实践与数据分析实战(含可视化)

数据分析，商业实践，数据可视化，网络爬虫，统计学，Excel，Word, 社会心理学，认知心理学，行为科学，民族意志学各种专栏后续疯狂补充

欢迎评论与私信交流！

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Python Pandas 快速插入列，快速筛选数据：强大到飞起的 eval 和 query 函数

引言在使用 Python 的 Pandas 库处理数据时，我们时常需要添加一些新列，时不时添加一列也就算了，同时添加多列(毫无规律的，不使用循环)时是真的气人，还有就是快速选择符合条件的数据框有时也会成为令人难受。业务需求 & 效果实现快到飞起的 eval()笔者将效果实现分成了几个版本低端累到不能呼吸版最基础的列操作了中端客可喘气版这个版本借助了...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。