【一点分享】Python数据分析(7):Pandas做统计,比sql更有意思吧。

在前面几篇文章中,已经把大概用到的知识点进行了分享,本文进行4种场景的实战练习。

1、日期维表

之前的案例,对日期进行过特殊处理。今日,引入日期维表,就不需要那么复杂。可以事先在公共日期维表中实现好,直接引用即可。

2、每周的注册用户数

用的日期维表的周来关联统计,就不用单独去判别周了,非常方便。

3、模拟sql的case_when统计

实现还是很巧妙的,以下2种解法都很值得学习,当然还有自定义函数(把lambda拆份出来就行),不在这里演示了。

4、用户留存

留存,最重要的是理解留存的逻辑。

5、总结

(1)本文场景都是真实的,处理时以结果为导向,寻求解决方案,会迫使去查找挖掘更合适的实现方式,尤其是各种函数组合使用。

(2)在dataframe的链式操作中,出现2个案例用了双层的lambda表达式,非常爽,避免了去单独定义一个def函数再来使用。外层的lambda参数x是df,再把df的某列传入内层,那内层的lambda参数y去处理就是该列的每一行。

还有更多实用操作,请关注下一篇文章。请留言获取源码。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值