数据仓库原理&实战【2】

本文详细介绍了数据仓库中的事实表类型,包括事务事实表、周期快照事实表和累计快照事实表,以及它们的实现策略。此外,还探讨了拉链表的概念,它是保留数据历史状态的重要手段。最后,讨论了数据ETL过程中的全量同步和增量同步策略,以及任务调度在数据仓库中的应用。
摘要由CSDN通过智能技术生成


表的分类

1.1维度建模中表的类型

(1)事实表:一般是指一个现实存在的业务对象,比如用户、商品、商家、销售员等,根据表的功能不同可以分为事务事实表、周期快照事实表、累计快照事实表;
在这里插入图片描述

(2)维度表:

  • 一般是指对应一些业务状态,代码的解释表。也可以称之为码表
  • 通常使用维度对事实表中的数据进行统计、聚合运算
  • 就是在查询过程中可以对数据进行筛选或组织,主要是增加多维分析的一个性能,使多维分析变得更加灵活。
    在这里插入图片描述

1.2事实表的三种分类

1.2.1事务事实表

其概念是随着业务不断产生的数据,一旦产生就不会在改变,如交易流水、操作日志、出库入库记录等,以交易流水为例:
在这里插入图片描述
这种表在数仓这块建设起来比较容易,因为数仓本身就不予许修改,这种顺序追加的表就很好实现。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值