有的同学在处理自己的业务逻辑的时候,需要用到Row Number的方法,那么,什么是Row Number呢?
例如我们有下面的数据,第一列是用户的ID,第二列是用户的购买日期,现在如果我们需要判断用户是否重复购买,并且,每一次的购买,下一次的购买时间间隔是多少呢?
id,date
1,20150601
1,20150603
2,20150601
2,20150605
2,20150610
3,20150503
3,20150603

本文介绍了在Pandas中如何根据Group By操作为每组数据计算Row Number,用于识别用户重复购买行为并计算购买间隔。通过排序、groupby和rank方法实现,最后通过merge方法连接数据,得到目标结果。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



