在前面几篇文章中,已经把大概用到的知识点进行了分享,本文进行4种场景的实战练习。
1、日期维表
之前的案例,对日期进行过特殊处理。今日,引入日期维表,就不需要那么复杂。可以事先在公共日期维表中实现好,直接引用即可。
2、每周的注册用户数
用的日期维表的周来关联统计,就不用单独去判别周了,非常方便。
3、模拟sql的case_when统计
实现还是很巧妙的,以下2种解法都很值得学习,当然还有自定义函数(把lambda拆份出来就行),不在这里演示了。
4、用户留存
留存,最重要的是理解留存的逻辑。
5、总结
(1)本文场景都是真实的,处理时以结果为导向,寻求解决方案,会迫使去查找挖掘更合适的实现方式,尤其是各种函数组合使用。
(2)在dataframe的链式操作中,出现2个案例用了双层的lambda表达式,非常爽,避免了去单独定义一个def函数再来使用。外层的lambda参数x是df,再把df的某列传入内层,那内层的lambda参数y去处理就是该列的每一行。
还有更多实用操作,请关注下一篇文章。请留言获取源码。