用户连续活跃区间记录表设计

本文探讨了数据库设计中的活跃度字段处理,包括创建DWS.mall_app_uac_range表来存储用户活跃区间,并介绍了缓慢变化维的概念,提到了重写维度值和插入新维度行两种处理方式。此外,还提及了一种用32位二进制表示用户活跃天数的设计方法。
摘要由CSDN通过智能技术生成

字段包含

日期首访日期guid连续活跃区间起始日连续活跃期间结束日
2022-03-01g012022-03-012022-03-10
2022-03-01g012022-04-019999-12-31
2022-03-04g022022-03-049999-12-31
2022-04-01g032022-04-012022-04-03

建表

create table dws.mall_app_uac_range(
    guid            bigint
    ,first_login_dt string
    ,range_start_dt string
    ,range_end_dt   string
)
partitioned by (dt string)
stored as orc
tblproperties('orc.compress'=''snappy)

缓慢变化维概念 

提出:业务中根据

根据不同的业务需求,有些历史数据需要保存,有些则不需要

三种处理缓慢变化维的方式

1.重写纬度值

2.插入新的维度行

插人新的维度行。采用此种方式,保留历史数据,

维度值变化前的事实和过去的维度值关联,维度值变化后的事实和当前的维度值关联

还有另外一种活跃度设计

bitmap

以二进制的形式,总共有32位的二进制

第几天有用户活跃,第几个位上的数字就设置为1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值