数仓建模理论

数仓的模型

ER模型

ER模型的数仓主要是应用于OLTP,更加倾向于整合企业总体的数据,不适合用作分析使用,更多的是后端在使用。
ER模型常用于OLTP数据库建模,应用到构建数仓时更偏重数据整合,站在企业整体考虑,将各个系统的数据按相似性一致性进行合并处理,为数据分析、决策服务,但并不便于直接用来支持分析。
问题(特点):

  1. 需要全面梳理企业所有的业务和数据流;
  2. 实施周期长;
  3. 对建模人员要求高。

ER模型遵循3NF范式,目的是减少数据冗余,增强数据的一致性.
3NF: 这三种情况,表还可以更加深度的分割。
第一范式: 属性不可分割
错误示例:

ID 分数
stu001 高数90
stu002 大学物理 70

正确的示例:

ID 科目 分数
stu001 大学物理 70
stu002 高数 90

第二范式: 不能存在部分函数依赖

错误示例:

ID 科目 分数
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值