数据仓库建模

kimball建模:

  1. 分析业务流程:客户产生消费
  2. 确定最小粒度:每天每个账户
  3. 确定维度表:账户信息表
  4. 确定事实表:账户消费表

维度建模:星型模型、雪花模型!!

  • 星型模型:一张事实表(横表),关联多张维度表
  • 雪花模型:将维度表拆分为符合范式的多张维度表

范式建模:各表完全拆分,符合三范式

维度建模、范式建模对比:维度建模(宽表)方便查询,减少关联,但是占空间,不利于更新,适用于面向下游用户的数据集市;范式建模省空间,利于更新维护,但关联较多,不利于查询,适用于底层数据仓库。

常用星型模型,反范式设计以空间换时间,存在数据冗余但便于查询。

三范式:

  1. 1NF:原子性,每一列属性都是不可再分的属性值(一个字段不可拆分为多个不相关字段)。
  2. 2NF:非主键字段由主键完全确定(且不是由主键的某一部分确定)。
  3. 3NF:非主键不能由其他非主键完全确定。

数据仓库层次结构

  • ods库:明细数据层(从上游获取的原始数据)
  • dim库:维度数据层
  • adm库:汇总数据层
  • vdm库:视图数据层

维度表的历史保存:昨日切片表+历史拉链表

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值