数据仓库建设的理解

本文介绍了数据仓库的定义和价值,以及通用的三层架构:源层、数据仓库层和数据集市。数据仓库层通常采用星型或雪花型模型,Teradata建模方式结合两者的优点。数据集市则根据业务需求进一步加工数据。分层设计能提高数据管理效率,规范数据结构,并降低复杂性。
摘要由CSDN通过智能技术生成

1.数据仓库的定义及价值

数据仓库(Data Warehouse,简称“DW”)的概念由“数据仓库之父”比尔.恩门(Bill Inmon)在1990年提出,它主要是面向主体、集成的、相对稳定的、反应历史变化的数据集合,也可称为数据环境,用于支持管理决策,也便于进行下游OLAP、数据挖掘(Data Mining),分析有价值数据,帮助构建商业智能。

2.数据仓库通用架构划分(粗分)

基于实际情况,数据仓库顶层架构通常做3级划分,分别是源层(Data Source),DW(数据仓库层),数据集市(Data Mart)。

源层:也叫数据源层,有些地方也叫ODS层,主要是为数据仓库提供统一的数据来源,将各类业务系统,不论异构还是同构,数据进行统一、集中化处理,同时做一些数据的清洗、整理工作。源层会保留一定时间的数据。

DW:数据仓库层,是数仓建设的核心,通常遵循的建设的方式有:“星型模型”和“雪花型模型”,但前提都遵循3NF的建模。

  • 星型模型”是“维度建模”的一种典型,是以一个事实表和一组维度表组成,是以分析决策的需求出发构建模型,协助用户快速的做业务分析,支持快速响应用户查询,更直接面向业务,不需要join很多表。

                              

  • 雪花模型”是关系建模的典型,也是“星型模型”的另一种扩展,当一个或多个维度表通过另外维度表连接到事实表时,其形状就像多个雪花连接在一起。可理解为“星型模型”中的某些维度表是其他维度表的事实表。“雪花模型”设计方式比较符合数据库范式理论,设计方式比较正规,数据冗余少,但查询时需要join多张表,效率相对较低,后期维护比较复杂。两者优劣比较&#x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值