数据仓库系列之维度建模

最新推荐文章于 2024-04-09 00:51:14 发布

weixin_30552635

最新推荐文章于 2024-04-09 00:51:14 发布

阅读量1.2k

点赞数

文章标签：大数据数据库

原文链接：http://www.cnblogs.com/fly-bird/p/11336261.html

版权

本文主要介绍维度建模方法，这是Ralph Kimball提出的，用于构建数据仓库和数据集市。维度建模强调事实表和维度表，便于快速分析和大规模查询。文章探讨了星型模型、雪花模型，并解析了事实表和维度表的概念，以及维度建模的优缺点。同时，提到了数据仓库的架构、建模方法和辅助系统，并以电商场景为例进行建模实践。

摘要由CSDN通过智能技术生成

上一篇文章我已经简单介绍了数据分析中为啥要建立数据仓库，从本周开始我们开始一起学习数据仓库。学习数据仓库，你一定会了解到两个人：数据仓库之父比尔·恩门（Bill Inmon）和数据仓库权威专家Ralph Kimball。Inmon和Kimball两种DW架构支撑了数据仓库以及商业智能近二十年的发展，其中Inmon主张自上而下的架构，不同的OLTP数据集中到面向主题、集成的、不易失的和时间变化的结构中，用于以后的分析;且数据可以通过下钻到最细层，或者上卷到汇总层;数据集市应该是数据仓库的子集;每个数据集市是针对独立部门特殊设计的。而Kimball正好与Inmon相反，Kimball架构是一种自下而上的架构，它认为数据仓库是一系列数据集市的集合。企业可以通过一系列维数相同的数据集市递增地构建数据仓库，通过使用一致的维度，能够共同看到不同数据集市中的信息，这表示它们拥有公共定义的元素。

这里我主要介绍维度建模方法。这一方法是Kimball最先提出的，其最简单的描述就是按照事实表、维度表来构建数据仓库、数据集市。在维度建模方法体系中，维度是描述事实的角度，如日期、客户、供应商等，事实是要度量的指标，如客户数、销售额等。按照一般书籍的介绍，维度建模还会分为星型模型、雪花模型等，各有优缺点，但很少直接回答一个问题，也就是数据仓库为什么要采用维度建模？