目录
前言
在日常提数中,经常会需要各类用户的分布,比如:
- DAU(日活跃用户)中的新老用户分布
- 各平台用户分布
- 各渠道用户分布
- 各年龄段用户分布
- 用户性别分布
- 某种行为的用户分布(购买1次的有多少人,2次的有多少人……)等等等等。
本文就来介绍一下这些分布数据的提取sql。分布听起来高大上,其实就是按照各个维度进行聚合然后计数罢了,没什么难度。下文用到的表字段含义见实战篇(二)。
1. DAU中的新老用户分布
因为日活表中没有一个字段可以判断用户是否为新用户,所以不能直接进行聚合计算,这里分别计算后关联到一起即可。
WITH new_user
AS (--新用户数
SELECT day
本文介绍了如何使用Hive进行用户分布分析,包括DAU中新老用户、各平台、各渠道、年龄段、性别以及购买次数的用户分布的提取方法。通过聚合计数和处理不同格式的数据,实现对用户行为的全面洞察。
订阅专栏 解锁全文
2650

被折叠的 条评论
为什么被折叠?



