大数据建模篇--维度建模

最新推荐文章于 2024-08-01 00:00:00 发布

在路上的小y

最新推荐文章于 2024-08-01 00:00:00 发布

阅读量764

点赞数

分类专栏：大数据文章标签：大数据 hive

本文链接：https://blog.csdn.net/qq_43709558/article/details/127051824

版权

大数据专栏收录该内容

33 篇文章 8 订阅

订阅专栏

维度建模法
维度建模法: 就是按照事实表和维度表来构建数仓

一般在数仓DWD层进行建模.

有星型模型,雪花模型,星座模型.

星形模型:事实表可以关联多个维度表,维度表之间没有关系
雪花模型:事实表关联维度表,然后维度再关联维度表,维度表间有关系
星座模型:多个事实表关联相同的维度表

典型代表:星型模型

好处:

星型模型的设计方式主要带来的好处是能够提升查询效率，因为生成的事实表已经经过预处理，主要的数据都在事实表里面，所以只要扫描事实表就能够进行大量的查询，而不必进行大量的join，其次维表数据一般比较少，在join可直接放入内存进行join以提升效率，除此之外，星型模型的事实表可读性比较好，不用关联多个表就能获取大部分核心信息设计维护相对比较简单。通过大量的冗余来减少表查询的次数从而提升查询效率，星型模型对OLAP的分析引擎支持比较友好，这一点在Kylin中比较能体现。

维度建模步骤:
1.选择需要进行分析决策的业务过程.

业务过程可以是单个业务事件，比如交易的支付、退款等；也可以是某个事件的状态，比如当前的账户余额等；还可以是一系列相关业务事件组成的业务流程，具体需要看我们分析的是某些事件发生情况，还是当前状态，或是事件流转效率。

2.选择粒度

在事件分析中，我们需要预判所有分析需求细分的程度，从而决定选择的粒度，粒度是维度的一个组合。

3.确定维度

选择好粒度之后，就需要基于粒度设计维表，包括维度属性，用于分析时进行分组和筛选。

4.确定事实

确定分析需要衡量的指标。