pandas作为python的十大流行库之一,是数据科学爱好者们经常用的数据分析工具,针对绝大多数业务场景,利用好它便可以轻松、高效地完成数据处理任务。
我们来看一个稍微复杂一点的例子:分组取前5
任务:分组取前5-名学生的数学成绩以及对应的id
import
普通方法:
ts
groupby+apply方法:
# 自定义取数学成绩前五高(倒序排序)的方法
可以看到相同的任务循环100次:
方式一:普通实现:平均单次消耗时间:11.06ms
方式二:groupby+apply实现:平均单次消耗时间:3.39ms
相比之下groupby+apply的实现快很多倍,代码量也少很多!