业务背景:通过用户的登录行为,分析用户的日周月活跃指标
在进行本次实践之前,假设你已经产生了用户的登录日志, 并保存于Hive数仓中的 dwd_start_log
分层说明:
- ODS 原始数据层(original data)
- DWD 明细数据层 (结构与原始数据层基本保持一直),存放经过清洗过滤之后的数据
- DWS 服务数据层 ,轻度汇总,细粒度的统计
- ADS 数据应用层 ,通常为宽表
每日活跃用户明细
- 创建hive表
drop table if exists dws_uv_daily_daily;
create external table dws_uv_detail_daily(
`mid_id` string COMMENT '设备唯一标示',
`user_id` string COMMENT '用户标示',
`version_code` string COMMENT '程序版本号',
`version_name` string COMMENT '程序版本名称',
`lang` string COMMENT '系统语言',
`source` string COMMENT '渠道号',
`area` string COMMENT '区域',
`model` string COMMENT '手机型号',
`brand` string COMMENT '品牌',
`sdk_version` string COMMENT 'sdk版本',
`myTaoBao` string COMMENT '名称',
`height_width` string COMMENT '屏高',
`app_time` string COMMENT '日志产生时间',
`network` string COMMENT '网络模式',
`lng` string COMMENT '经度',
`lat` string COMMENT '纬度'
) COMMENT '活跃用户日明细'
PARTITION by ('dt' string)
stored as parquet
location '/warehou/myTaoBao/dws/dws_uv_detail_daily';