数据仓库建模

一、什么是数仓建模

  • 定义:数仓建模指的就是如何构建表的操作

二、常见的建模方式

  • 三范式建模
    • 以业务为导向的,要求在建表的时候,表应该是有一个主键的,在建表的时候,尽可能避免数据的冗余情况发生
  • 维度建模法
    • 以分析为导向的,构建表的时候,要求能够满足分析的要求,设计的时候,能够让目标分析更加简单,建模越加合理,在利于分析的要求下,允许数据出现一定的冗余
      在这里插入图片描述

三、维度建模中的两种表模型

  • 事实表
    • 指的分析主题所有对应的表,或者需求所对应的表或者进行指标计算字段所在表
    • 特点:一般是由一坨外键(其他表主键)的聚集的表
  • 维度表:在对事实表根据各个维度进行统计分析的时候,可能需要关联上其他的表,此时其他的表一般称为维度表

在一些特殊的情况下,有一些表既是当前主题的事实表,又是其他主题的维度表

四、数仓发展的三种发展模型

  • 星型模型:
    • 特点:只有一个事实表,也就是只有一个分析的主题,有多个维度表,多个维度表之间没有任何的关联
    • 这种模型是数仓发展的什么时期容易产生的模型:中期
  • 雪花模型:
    • 特点:只有一个事实表,也就是只有分析的主题,有多个维度表,维度表可以接着关联其他的维度表
    • 这种模型是数仓发展的什么时期容易产生的模型:数仓出现了畸形的情况下,有可能产生模型,这种模型下,非常不便于维护和分析,在实际使用尽量避免这种模型出现
  • 星座模型:
    • 特点:有多个事实表,也就是有多个分析的主题,有多个维度表,在条件复合的情况下,多个事实表之间的维度可以进行公用
  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
IBM数据仓库建模方法论(IBM Data Warehouse Modeling Methodology)是IBM为构建高质量的数据仓库而制定的一套建模方法与指导原则。其目标是帮助组织实现数据驱动决策和分析,从而提高业务效率和竞争力。 该方法论主要包括以下几个方面: 1. 需求分析:在开始建模之前,首先要深入了解业务需求和数据源。通过与利益相关者合作,明确数据需求、目标与范围,以及数据的重要性和可用性。 2. 数据模型设计:根据需求分析结果,设计合适的数据模型来存储和组织数据。这包括确定实体、属性、关系和约束等概念,并选择合适的建模工具和技术来解决特定问题。 3. 数据抽取与装载:将源系统中的数据抽取到数据仓库中。这涉及到数据清洗、转换和加载等步骤,以确保数据的准确性和一致性。 4. 数据仓库更新:持续监控和更新数据仓库中的数据,包括定期的数据抽取和转换过程,以保持数据的实时性和准确性。 5. 数据仓库查询与分析:提供灵活的查询和分析功能,以支持决策和业务需求。这包括使用各种BI工具和技术来提取、分析和可视化数据。 6. 数据质量管理:确保数据仓库中的数据质量高且可信。通过建立数据验证和监控机制,及时发现和纠正数据质量问题。 7. 数据安全与隐私保护:采取必要的安全措施,保护数据仓库中的数据不受未经授权的访问和泄漏。 通过遵循IBM数据仓库建模方法论,组织可以更好地管理和利用数据,提高数据仓库的效率和价值。同时,该方法论还提供了一套通用的指导原则和最佳实践,适用于各种规模和复杂度的数据仓库项目。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值