数仓理论 —— 缓慢变化维

1 什么是维度

参考网址:深入解析数据仓库中的缓慢变化维

在数据仓库的DW层中,表根据用途往往会分为2个类型:FACT(事实表)和 DIM(维度表)。

举个例子,如果我们要描述一个餐饮过程:

小明 2020年4月19日下午3点20分 在 海底捞(万达广场) 吃了5道菜,每道菜的单价是4元,总价是20元。

那么这个过程在数仓中,会如此划分:

  • fact:餐饮过程,单价、数量、总价
  • dim:小明,餐饮时间,餐饮门店,菜名。

也就是说:
吃了多少东西,多少钱——这些属于fact;
在哪里吃、什么时候吃?这些属于dim。

下面是简单的ER图,方便大家更好的理解。
在这里插入图片描述

2 缓慢变化维概念介绍

关于数据仓库中缓慢变化维的总结

3 缓慢变化维的处理方法

根据面临的不同场景,可采用的处理方法不同,因此有多种处理方法。《深入解析数据仓库中的缓慢变化维》一文讲解了多个方法,建议仔细阅读。

常见的有:

  1. 拉链表
    在原有维度表的基础上,加两个字段:开始时间,结束时间。没结束的结束时间就设一个超级大的值。
    拉链表的优点:节约存储。(但大数据环境下,这点存储也没啥。)
    数据仓库-缓慢渐变维-拉链表

  2. 需要分别统计变化前后的数值时,增加新行,且使用代理键。
    场景举例:《深入解析数据仓库中的缓慢变化维》
    生成代理键的方法:Hive 中如何生成代理键

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

张之海

若有帮助,客官打赏一分吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值