维度模型- 快变巨大维度

1.问题

维度做拉链的方式时, 有些维度本身就巨大,比如千万级别的客户, 其中个别属性变化比其他属性明显频繁, 比如客户的年龄,住址等, 导致本身巨大的维度表快速膨胀。

2. 目标

维度模型的优点就是简单和高性能, 维度又是看书的口径, 所以维度建设的目标就是怎么简单高效的查看事实表数据。

3. 处置方式一:分离快变属性成单独的客户快变属性维度表

即:把客户属性分到两个维度表中。 三范式建模经常这么搞。

优点:简单,基础维度属性的变化频率降低了

缺点: 快变属性的变化还是快, 关联事实表的性能不好。

建议: 不建议采用。

4.处置方式二:kimball 快变维度处置方式

也是把快变维度属性分离出来,但是不是每个客户一行, 而是这些属性的笛卡尔积组成维度的行,然后维度表直接挂到事实表上。

优点: 基础表变化频率降低了, 而且快变维度表的行数比较固定,可能极小。通过维度查询事实表简单高效。

缺点一:复杂,   快变维度表怎么挂到事实表的,你得知道事实表行对应的快变属性的值,然后关联快变维度表转换成快变维度表的主键。

缺点二:维度浏览性不好,   不能再通过分离出来的快变维度属性浏览客户了。  基础维度表表加外键也不行,加了外键,又变成快变维度了。 除非外键指向的是用户的最新的快变维度属性。这就会引起歧义: 基础表上的是最新值, 事实表关联的是历史值。

再去看看想想, 这块难搞

回到缺点一, 本身就应该有一个记录客户基础属性和快变属性的表, 才能实现把快变维度属性挂到事实表上。 如果想浏览客户维度表, 把这个表暴漏出来吧。

  • 18
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值