数仓(五)：数据建模--ER模型/维度建模，概念模型/逻辑模型/ 物理模型

四月天03

已于 2022-08-03 16:36:49 修改

阅读量1.3w

点赞数 6

分类专栏： Hive 数仓&数据中台文章标签：大数据数据仓库

于 2021-04-22 14:14:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22473611/article/details/116012611

版权

数仓&数据中台同时被 2 个专栏收录

23 篇文章 94 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

13 篇文章 39 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

一、数仓建模的目标

访问性能：能够快速查询所需的数据，减少数据I/O。
数据成本：减少不必要的数据冗余，实现计算结果数据复用，降低大数据系统中的存储成本和计算成本。
使用效率：改善用户应用体验，提高使用数据的效率。
数据质量：改善数据统计口径的不一致性，减少数据计算错误的可能性，提供高质量的、一致的数据访问平台。

所以，大数据的数仓建模需要通过建模的方法更好的组织、存储数据，以便在性能、成本、效率和数据质量之间找到最佳平衡点。

二、关系模式范式

关系型数据库设计时，遵照一定的规范要求，目的在于降低数据的冗余性和数据的一致性，目前业界范式有：

第一范式（1NF）：

域都是原子性的，即数据库表的每一列都是不可分割的原子数据项。

例如下面这张表：

ID 商品商家ID 用户ID
1 4件毛衣 B0001 U00001
“商品”字段就不是原子性的，可以分割成“4件”和“毛衣”。

第二范式（2NF）：

在1NF的基础上，实体的属性完全依赖于主关键字，不能存在仅依赖主关键字一部分的属性，也就是不存在局部依赖。

例如下面这张表：

学生ID   所属系   系主任   所修课程   分数
S001   物理系   张三   C001   90
S001   物理系   张三   C002   100

了解本专栏

超级会员免费看

关注

6
点赞
踩
69

收藏

觉得还不错? 一键收藏
打赏
0
评论
数仓(五)：数据建模--ER模型/维度建模，概念模型/逻辑模型/ 物理模型

一、数仓建模的目标访问性能：能够快速查询所需的数据，减少数据I/O。数据成本：减少不必要的数据冗余，实现计算结果数据复用，降低大数据系统中的存储成本和计算成本。使用效率：改善用户应用体验，提高使用数据的效率。数据质量：改善数据统计口径的不一致性，减少数据计算错误的可能性，提供高质量的、一致的数据访问平台。所以，大数据的数仓建模需要通过建模的方法更好的组织、存储数据，以便在性能、成本、效率和数据质量之间找到最佳平衡点。二、关系模式范式关系型数据库设计时，遵照一定的规范要求，目的在于降低.
复制链接

扫一扫

专栏目录

四月天03

CSDN认证博客专家 CSDN认证企业博客

码龄10年

大数据领域优质创作者

270: 原创

1755: 周排名

1万+: 总排名

105万+: 访问

: 等级

7102: 积分

4万+: 粉丝

802: 获赞

126: 评论

5761: 收藏

私信

关注

热门文章

分类专栏

最新评论

CDH大数据平台
小小一心: 1、这个文章不全一呀， 2、大数据平台：华为的dws也有啊 3、报表平台还有：Dataease，PowerBI 4、调度的还有xxl-job
CDH/HDP迁移星环大数据产品TDH
青鸟曼舞: hive来自Facebook ，hadoop 来自阿帕奇基金会，Java现在属于oracle，国产化替代是大趋势，单不是你漫天要价的理由，50节点50万美金，你疯了吧！！！！
Django--基于Python的Web应用框架
热心码民阿振: 质量很高，细节很到位,博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享，期盼博主能够光顾我的博客，给予宝贵的指导！
Flink CDC 系列 - 同步 MySQL 分库分表，构建 Iceberg 实时数据湖
weixin_36022116: 如果是将大表写入到分表【128个分表】中该如何实现呢？
WORD批量修改文献引用为上标
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录；(3)增加除了各种控件外，文章正文的字数。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

四月天03 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。