数仓的模型
ER模型
ER模型的数仓主要是应用于OLTP,更加倾向于整合企业总体的数据,不适合用作分析使用,更多的是后端在使用。
ER模型常用于OLTP数据库建模,应用到构建数仓时更偏重数据整合,站在企业整体考虑,将各个系统的数据按相似性一致性进行合并处理,为数据分析、决策服务,但并不便于直接用来支持分析。
问题(特点):
- 需要全面梳理企业所有的业务和数据流;
- 实施周期长;
- 对建模人员要求高。
ER模型遵循3NF范式,目的是减少数据冗余,增强数据的一致性.
3NF: 这三种情况,表还可以更加深度的分割。
第一范式: 属性不可分割
错误示例:
ID | 分数 |
---|---|
stu001 | 高数90 |
stu002 | 大学物理 70 |
正确的示例:
ID | 科目 | 分数 |
---|---|---|
stu001 | 大学物理 | 70 |
stu002 | 高数 | 90 |
第二范式: 不能存在部分函数依赖
错误示例:
ID | 科目 | 分数 |
---|