公共层和数据集市层的区别和特点?(高频)

本文深入解析数据仓库的分层架构,从公共维度模型层到应用数据层,涵盖CDM、DWD、DWS、ADS等层级的功能与作用。探讨了维度模型、汇总数据、宽表构建以及数据集市的概念,旨在提升数据处理效率与准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

公共维度模型层(CDM):存放明细事实数据、维表数据及公共指 标汇总数据 ,其中明细事实数据、维表数据一般根据 ODS 层数据加工生成 :公共指标汇总数据一般根据维表数据和明细事实数据加工生成。

CDM 层又细分为 DWD 层和 DWS 层,分别是明细数据层和汇总数据层,采用维度模型方法作为理论基础 ,更多地采用一些维度退化手法, 将维度退化至事实表中,减少事实表和维表的关联 ,提高明细数据表的易用性 :同时在汇总数据层, 加强指标的维度退化, 采取更多的宽表化 手段构建公共指标数据层,提升公共指标的复用性,减少重复加工。其主要功能如下。

  1. 组合相关和相似数据:采用明细宽表,复用关联计算,减少数据 扫描。公共指标统一加工:基于OneData 体系构建命名规范、口径一致
  2. 和算法统一的统计指标,为上层数据产品、应用和服务提供公共 指标 z 建立逻辑汇总宽表。
  3. 建立一致性维度:建立一致的数据分析维表,降低数据计算口径、 算法不统一的风险。 应用数据层(ADS):存放数据产品个性化的统计指标数据,根据 CDM 层与 ODS 层加工生成。

数据基础层主要对ODS的数据进行质量检查、清洗、转换、汇总,产出符合质量要求的汇总表、明细表、维度表、码表、事实集等基础数据的公共数据中心。其自身总共包含明细层(DWD)和汇总层(DWS),其中汇总层的数据又分为轻度汇总数据(DWB)和重度汇总数据(DWS)。数据基础层实际上与ODS层差别不大,都是建立以ER为中心的数据关系,方便以后的数据的聚合。数据内容主要负责采集业务系统并保存一定期限内的相关业务数据。当然也可以满足用户对明细数据的查询要求,姑且也可以算作明细数据仓库。

主题层是数据的高度聚合层,按照一定的维度和业务逻辑,对一类数据进行聚合,主要生成画像主题表。主体层的数据来源是基础层和ODS层。

数据集市(Data Mart) ,也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。主要是将主题层和基础层的数据,按各业务需求进行聚合,生成宽表和Cube,并直接推送给数据分析和业务部门使用,有利于提升数据准确性和取数效率(性能)。因此数据集市(DM)可以理解为是一种“小型数据仓库”,一般面向部门、单个主题或特定应用,且之间互不影响。

关于汇总层的的轻度汇总和重度汇总概念。轻度汇总数据主要存储以用户、产品、协议等为维度各业务线进行的简单统计数据;重度汇总数据来源包括明细数据和轻度汇总数据(可以理解为汇总再汇总),其主要记录多业务的统计数据和时间跨度大的统计数据,dws的数据大多以宽表形式存在。一般轻度汇总1亿条数据汇总后也有千万数据,而重度汇总就是只基于关键维度汇总,一般1亿数据只有百万甚至十万级数据量,但很多细节会丢失。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Doctor_96

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值