电商项目相关问题
1.Tez引擎优点?
答:Tez可以将多个有依赖的作业转换为一个作业,这样只需写一次HDFS,且中间节点较少,从而大大提升作业的计算性能。
2.在项目中是否自定义过UDF、UDTF函数,以及用他们处理了什么问题?
答:用UDF函数解析公共字段,输入一输出一;用UDTF函数解析事件字段,输入一输出多。
3.如何分析用户活跃?
答:在启动日志中统计不同设备id 出现次数。
4.如何分析用户新增?
答:用活跃用户表 left join 用户新增表,用户新增表中mid为空的即为用户新增。
5.如何分析用户1天留存?
答:留存用户=前一天新增 join 今天活跃
用户留存率=留存用户/前一天新增
6.如何分析沉默用户?
按照设备id对日活表分组,登录次数为1,且是在一周前登录。
7.如何分析本周回流用户?
本周活跃left join本周新增 left join上周活跃,且本周新增id和上周活跃id都为null
8.如何分析流失用户?
按照设备id对日活表分组,且七天内没有登录过。
9.如何分析最近连续3周活跃用户数?
按照设备id对周活进行分组,统计次数大于3次。
10.如何分析最近七天内连续三天活跃用户数?
1)查询出最近7天的活跃用户,并对用户活跃日期进行排名
2)计算用户活跃日期及排名之间的差值
3)对同用户及差值分组,统计差值个数
4)将差值相同个数大于等于3的数据取出,然后去重,即为连续3天及以上活跃的用户