Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数

在这里插入图片描述

更多商业数据分析案例(原理,完整代码,数据集)、统计学、SQL、网络爬虫详见公众号 " 数据分析与商业实践 "

引言

  在使用 Python 的 Pandas 库处理数据时,我们时常需要添加一些新列,时不时添加一列也就算了,同时添加多列(毫无规律的,不使用循环)时是真的气人,还有就是快速选择符合条件的数据框有时也会成为令人难受。

在这里插入图片描述



业务需求 & 效果实现

快到飞起的 eval()

在这里插入图片描述
笔者将效果实现分成了几个版本

低端累到不能呼吸版
  最基础的列操作了
在这里插入图片描述


中端客可喘气版
  这个版本借助了循环的帮助,省去了复制粘贴该改数字
在这里插入图片描述
已经快了很多
在这里插入图片描述


高端畅顺呼吸版
  使用 eval 函数的同时借助循环的帮助,这里就只是展示 eval 的生成单列的用法。
在这里插入图片描述



同样快到飞起的 query()

功能不多说,看图说话即可,只展示 query 最常用的功能
在这里插入图片描述



总结

  两个函数的简单和最常见的用法不用说大家看图也能够理解,就是省去了打出文件名和中括号,借助循环的力量,找出列索引的规律;在数据清洗/文件批处理中非常常见。

  这两个相对来说冷门一些的函数不仅代码量大大减少,而且在内存执行速度上也会更快;**从版本0.13开始,Pandas 包含了一下实验性的工具允许你直接使用 C 速度操作,避免中间数组的浪费。这些工具是eval()和 query()函数,它们依赖 Numexpr包。**其实这只是这两个函数的冰山一角,各种快捷骚操作还等待着我们去探索 Pandas,Numpy 的快捷函数太多了,所以鲜有人敢自称自己精通 numpy pandas 或者只是其中一个库(熊猫创始人曾在视频中也对此感到无奈)。总的来说,替自己总是忘记快捷函数而感到担忧是完全没有必要的,只需牢记没有最快,只有更快,想得起来就用想不起来就查。



后记

延伸阅读

精彩回顾

  数据分析,商业实践,数据可视化,网络爬虫,统计学,Excel,Word, 社会心理学,认知心理学,行为科学,民族意志学 各种专栏后续疯狂补充

  欢迎评论与私信交流!

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值