字段包含
日期 | 首访日期 | guid | 连续活跃区间起始日 | 连续活跃期间结束日 |
2022-03-01 | g01 | 2022-03-01 | 2022-03-10 | |
2022-03-01 | g01 | 2022-04-01 | 9999-12-31 | |
2022-03-04 | g02 | 2022-03-04 | 9999-12-31 | |
2022-04-01 | g03 | 2022-04-01 | 2022-04-03 |
建表
create table dws.mall_app_uac_range(
guid bigint
,first_login_dt string
,range_start_dt string
,range_end_dt string
)
partitioned by (dt string)
stored as orc
tblproperties('orc.compress'=''snappy)
缓慢变化维概念
提出:业务中根据
根据不同的业务需求,有些历史数据需要保存,有些则不需要
三种处理缓慢变化维的方式
1.重写纬度值
2.插入新的维度行
插人新的维度行。采用此种方式,保留历史数据,
维度值变化前的事实和过去的维度值关联,维度值变化后的事实和当前的维度值关联
还有另外一种活跃度设计
bitmap
以二进制的形式,总共有32位的二进制
第几天有用户活跃,第几个位上的数字就设置为1