目录
一:留存定义
以天为单位,跨天后再来访问即为留存,例如给定我们的需求:
知道指定日期后隔1-14天的留存,如2020-08-01天来的访客,之后1天,2天,3天,....再来人数。
注意:我们要清楚留存是针对谁(那个日期)来说的例如用户a25日有记录,26日没有记录,27日有记录。
那么我们是针对25日来说的,也就是说25日的用户a,1日留存没有, 有2日留存。
留存率:具体问题具体分析,一般分母都是2020-08-01的人数。
二:真实需求,求14日的留存
2.1 源数据
我们以访问留存为例,数据表位于 dwd.pv_log
,以下为其中涉及的部分:
uuid | ctime | p_day |
---|---|---|
562234 | 2020-05-08 11:09:19.0 | 20200508 |
783425 | 2020-05-08 12:09:19.0 | 20200508 |
342643 | 202 |