框架版本,服务器选型,集群规划
埋点数据
事件日志:logback
Hadoop:HDFS多目录,LZO解压,基准测试
Zookeeper
集群日志生成启动脚本,同步修改脚本,进程查看脚本
日志采集Flume
ETL拦截器
分类型拦截器
Kafka集群:压力测试,消费Flume数据
Kafka Manager
数仓分层
HIve&MySQL,Hive运行引擎Tez
ODS,DWD,DWS,ADS
自定义UDF,UDTF函数
每日周月活跃设备,用户
每日新增,用户留存
沉默用户,本周回流,流失用户,最近3周活跃用户数
最近7天连续3天活跃数
业务数仓
雪花模型、星型模型、星座模型
snappy压缩
Sqoop
GMV成交总额
用户行为漏斗分析
Azkaban
拉链表
即席数仓
Presto
Druid
CDH数仓
Oozie、Hue、Spark