构建数据仓库

liubotao84

已于 2024-04-09 08:39:47 修改

阅读量79

点赞数 1

文章标签：数据仓库

于 2024-04-08 11:29:30 首次发布

本文链接：https://blog.csdn.net/u013254794/article/details/137501306

版权

构建数据仓库依赖的建模方法为维度建模。维度建模简单描述就是按照维度表，事实表来构建数据仓库。事实就是一个度量单位，如浏览量，点赞量。维度就是上下文，如哪一天，谁，哪篇文章等。

数据仓库分为如下几层：

1.原始数据层（ODS）

原始数据层为业务侧原始数据备份。通常按照日期进行分区存放。原始数据进入本层一般需要进行数据清洗，把不符合条件数据进行清理掉。如格式错误数据或者属性不全的数据清除。

数据明细层建模需要根据业务维度构建业务总线矩阵。根据业务总线矩阵进行表建立。

汇总数据层为明细数据层聚合统计后的数据。

汇总数据层数据建模需要根据业务需要。汇总数据层的指标分为：原子指标，派生指标和衍生指标。

原子指标指的是基于业务过程的度量值，顾名思义是不可以在进行拆分的指标。

派生指标是基于原子指标的关系为
派生指标 = 原子指标 + 统计周期 + 业务+ 统计粒度

衍生指标是在一个或多个派生指标的基础上，通过各种逻辑运算符合而成的。

数据应用层对应数据展示，为最终展示数据。

关注