【DataW】建模理论

做一只精致IT小白

已于 2024-01-30 15:22:24 修改

阅读量402

点赞数 10

分类专栏：数据仓库文章标签：数据仓库

于 2024-01-24 15:05:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42969976/article/details/135822753

版权

数据仓库专栏收录该内容

14 篇文章 0 订阅

订阅专栏

本文探讨了数仓建模的目标，包括提升访问性能、降低成本、提高使用效率和保证数据质量。涉及范式理论，如第一、二、三范式，以及ER实体模型和Kimball维度建模方法，特别对比了星型模型和雪花模型在维表设计上的差异。

摘要由CSDN通过智能技术生成

数仓建模目标

1.访问性能：快速查询所需的数据，减少数据I/O

2.数据成本：减少不必要的数据冗余，实现计算结果数据复用，降低大数据系统中的存储成本和计算成本

3.使用效率：改善用户应用体验，提高使用数据的效率

4.数据质量：改善数据统计口径的不一致性，减少数据计算错误的可能性，提供高质量、一致的数据访问平台

范式理论

降低数据的冗余性和数据的一致性，目前范式有：

第一范式 - 第五范式、巴斯-科德范式（BCNF）

第一范式

域都是原子性的，数据库表的每一列都是不可分割的数据项

第二范式

在1NF的基础上，实体的属性完全依赖于主关键字，不能存在仅依赖住关键字一部分的属性，也就是不存在局部依赖。

第三范式

在2NF的基础上，任何非主体属性不依赖于其它非主属性，也就是不存在传递依赖。

建模方法

ER实体模型（关系建模）

实体：通常为参与到过程中的主体，客观存在的

属性：对主体的描述、修饰即为属性

关系：现实的物理事件是依附于实体的

实现步骤

1.抽象出主体

2.梳理主体之间的关系

3.梳理主体的属性

4.E-R关系图

其它

1.需要全面了解业务和数据

2.实施周期较长

Kimball（维度建模）

事实表

每个操作型事件，基本都是发生在实体之间，伴随发生会产生可度量的值，而这个过程会产生一个事实表，存储了每个可度量的事件。

事实表包含了与各维度表相关联的外键，并通过Join方式与维度表关联。

维度表

看待事物的角度，维度一般为单一主键。

维度建模通常分为星型模型和雪花模型。

星型模型

1.维表只和事实表关联，维表之间没有关联

2.每个维表的主键为单列，且主键放置在事实表中，作为两边连接的外键

3.以事实表为核心，维表围绕核心呈星型分布

雪花模型

对星型模型的扩展，每个维表可继续向外连接多个子维表。

星型模型和雪花模型的主要区别在于对维表的拆分；

对于雪花模型，维表的设计更加规范，一般符合3NF；而星型模型一般采用降维的操作，利用冗余来避免模型过于复杂，提高易用性和分析效率。

在实际项目中，更倾向于星型模型，以数据冗余来提高数据查询效率。

做一只精致IT小白

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【DataW】建模理论

每个操作型事件，基本都是发生在实体之间，伴随发生会产生可度量的值，而这个过程会产生一个事实表，存储了每个可度量的事件。在1NF的基础上，实体的属性完全依赖于主关键字，不能存在仅依赖住关键字一部分的属性，也就是不存在局部依赖。4.数据质量：改善数据统计口径的不一致性，减少数据计算错误的可能性，提供高质量、一致的数据访问平台。2.数据成本：减少不必要的数据冗余，实现计算结果数据复用，降低大数据系统中的存储成本和计算成本。2.每个维表的主键为单列，且主键放置在事实表中，作为两边连接的外键。
复制链接

扫一扫

专栏目录

做一只精致IT小白 CSDN认证博客专家 CSDN认证企业博客

码龄6年

30: 原创

53万+: 周排名

11万+: 总排名

3万+: 访问

: 等级

431: 积分

84: 粉丝

91: 获赞

1: 评论

62: 收藏

私信

关注

热门文章

分类专栏

MapReduce 3篇
Spark 4篇
Python 5篇
MySQL 1篇
Scala 2篇
Hive 3篇
数据仓库 14篇
调优 4篇
Java 4篇
Hadoop 3篇
Database 1篇

最新评论

DataWarehouse（总）数据仓库博客总览
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录；(3)增加除了各种控件外，文章正文的字数。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。