数据治理之数据建模八步走

本文详细介绍了数据仓库中的维度建模方法,包括确定需求、选择数据源、确定主题域和主题、设计数据模型、构建数据表结构、编写ETL存储过程、部署测试以及监控维护八个步骤。通过这些步骤,可以有效地构建满足业务需求的高效数据仓库系统。
摘要由CSDN通过智能技术生成

建模是指根据实际问题或系统的需求,将其抽象为一组数学模型,以便更好地进行分析、预测、优化、控制等操作。

数据仓库常见的数据建模思路有2:

  1. 范式建模:范式建模是数据库设计中的建模方法,其基本思想是将现实世界中的实体和实体之间的关系抽象成关系模型。
  2. 维度建模:维度建模是指按照事实表、维表来构建数据仓库、数据集市,最简单的描述就是以一颗“星”为中心,周围围绕着其他数据结构,维表里的数据量要比事实表里的少。

下面以数仓常用建模方式 -- 维度建模为例:

维度建模第一步:确定需求

  确定数据仓库系统的需求,包括主题域、业务过程、度量、数据源等 。在此步骤中,需要明确业务需求和用户需要获取的信息。这包括确定分析目标、识别业务过程和数据来源、确定数据维度和指标等。通常需要与业务人员进行讨论,了解他们的要求和期望,以确保维度模型能够满足业务需求。同时,还需考虑数据的完整性、可用性、适应性和准确性等因素,以确保维度模型的质量和实用性。

维度建模第二步:选择数据源

  选择合适的数据源,包括业务系统、外部数据等。

 在维度建模中选择数据源是非常重要的一步。在选择数据源时需要考虑以下因素:

  1. 数据质量:数据源的数据必须准确、完整、可靠,否则建模出来的数据仍然是垃圾数据。

  2. 数据量:数据源需要包含足够的数据以满足需求。

  3. 数据稳定性:数据源应该是稳定的,不会因为系统故障或其他因素而中断或无法访问。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值