数据仓库建模

最新推荐文章于 2024-03-18 12:00:18 发布

qq_43159264

最新推荐文章于 2024-03-18 12:00:18 发布

阅读量80

点赞数

分类专栏： bigdata 文章标签： hadoop hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43159264/article/details/119822235

版权

bigdata 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

数仓建模

指标:事务型指标，存量型指标，复合指标

数据层:操作数据层，公共纬度模型层，应用数据层，

构建过程

1、高层模型，对产出目标，进行维表和事实表进行图形描述
2、详细模型，对模型进行数据填充
3、验证，再设计
4、出文档

基本原则

1、一致性，字段名等统一
2、命名清晰可理解
3、高内聚低耦合
4、核心模型与扩展模型分离
5、公共处理逻辑下沉及单一
6、成本无性能平衡

纬度设计过程

1、确定主纬表
2、确定相关纬表
3、确定维度属性

维度表类型

维度表处理方法

1、雪花模型的纬度进行反规范化
2、拆分
3、缓慢变化维，处理方式：快照维表，解决缓慢变化维的问题，拉链表
4、递归表处理：进行扁平化处理，层次桥接表

5、微型纬度
6、行为纬度
7、多值纬度
8、多值属性
9、杂项纬度

纬度设计过程

1、选择业务过程确定事实表
2、声明粒度
3、确定纬度
4、确定事实
5、冗余纬度降维

事实表设计

1、事务事实表：单事务事实表，多事务事实表
2、周期快照实时表
3、积累快照事实表

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据仓库建模

数仓建模指标:事务型指标，存量型指标，复合指标数据层:操作数据层，公共纬度模型层，应用数据层，构建过程1、高层模型，对产出目标，进行维表和事实表进行图形描述2、详细模型，对模型进行数据填充3、验证，再设计4、出文档基本原则1、一致性，字段名等统一2、命名清晰可理解3、高内聚低耦合4、核心模型与扩展模型分离5、公共处理逻辑下沉及单一6、成本无性能平衡纬度设计过程1、确定主纬表2、确定相关纬表3、确定维度属性维度表类型维度表处理方法1、雪花模型的纬度进行反规范化2、拆
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。