[数据仓库]数据仓库中的分层架构

     为把Bill Inmon和Kimball 两种不同的思路统一起来,Bill Inmon提出了CIF(Corporation Information Factory)架构,核心是把数据仓库分为不同的层次以满足不同场景的需求;每层根据不同的场景采用不同的方案。

传统数据仓库1.0的分层:

数据源->数据集成平台->数据交换平台->数据集市(数据应用、数据汇总、数据明细)

传统数据仓库2.0的分层:

ODS->DWD->DWS->DM

  1. ODS(Operation Data Service):操作型数据服务,不做建模,和业务数据库保持一致
  2. DWD(Data WareHouse Detail):数据仓库明细层,采用ER 建模,一般到3NF ;对来源于多个业务系统的数据进行合并;如需要,在该层另外开辟一个区域作为公共维度层(DIM),把通用的主数据抽取出来按3NF建模。
  3. DWS(Data WareHouse Service):数据仓库服务层,采用维度建模,对DWD的数据进行按维度建模,可根据需要进行通用的轻微轻汇总,减少重复计算。
  4. DM(Data Market):数据集市层,采用维度建模、多维建模,根据业务需求对DWS层进行重度汇总,方便业务使用。

基于大数据的数据仓库:

Data Lake->DWD->DWS->DM->ADS(BI、推荐系统、用户画像、广告系统)

Data Lake:数据湖,采集企业的所有数据,包括结构化数据、半结构化数据、非结构化数据、媒体数据(音频、视频、图片);可以保留源数据格式或用Data Vault建模。

其他层和传统数仓几乎差不多。

ODS层的作用:

  1. 尽可能减少对源系统的影响
  2. 方便作业重新开始以及Debug
  3. 数据备份、方便数据审计
  4. 数据格式的统一
  5. 实时性要求高就不必ODS
  6. 必要时添加派生审计字段、去掉Clob、Blob字段、增加checkSum code

DW&DM层的区别:

 

DW

DM

需求

侧重于整合,下游为系统;侧重于共享性和权威性

侧重于分析,下游是报表;侧重于灵活性和多变性

模型

侧重于模型的稳定性,兼顾成本和效率

侧重访问的方便性

团队和管理

总部CIO主导,主数据、参照数据等核心数据由总部CIO审核

确保数据来源于DW,数据的Owner是数据使用部门

变更管理

谨慎面对变化,充分考虑对下游的影响

主动迎接变化,方便下游使用

访问

ETL、各系统的接口、低频次

高频次、最终用户

审计

数据变化的审计

报表的访问审计

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
层次的作用是什么? 回答: 数据仓库分层架构的各个层次有不同的作用。接入层是底层的数据源或操作数据层,用于统一管理和整合各种数据源的数据。间层是最复杂的一层,包括了最多的内容,主要用于数据仓库的建模和数据转换,以满足不同的分析需求。应用层则是为不同的应用提供对应的数据,主要用于数据产品和数据分析使用,比如报表数据。整个架构的目的是为了提供高效、可靠的数据分析和决策支持。\[1\] #### 引用[.reference_title] - *1* [数据仓库是如何分层的?](https://blog.csdn.net/Shockang/article/details/115816570)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [数据仓库分层,你知道吗?](https://blog.csdn.net/gggSam/article/details/119613649)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [数据仓库为什么要分层,各层的作用是什么](https://blog.csdn.net/aszhangwendi/article/details/126397961)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值