数据仓库怎么做分层,看这一篇文章就够了!

这是一张典型的数据仓库架构图。按自下而上的顺序,分别为数据仓库ETL(Extract-Transform-Load)层、ODS(Operational Data Store)层、CDM(Common Dimensional Model)层和ADS(Application Data Store)层。其中CDM层主要包括DWD层(Data Warehouse Detail)和DWS层(Data Warehouse Summary)两部分。

4e43b58e4f6395829e63449ace4be4fe.png

数仓架构图

开始之前给大家分享一份《数据仓库建设方案》,包含了数仓的技术架构、数仓建设关键动作、数仓载体/工具、配置参考、大数据场景支撑案例等内容,限时免费下载!

8dff177475c3e672a0f684367a00ab1f.png

数据仓库ODS层

数据仓库ODS层也称为操作数据源层,是数据仓库中的一个核心组成部分。该层主要用于保存原始数据,完成数据积存,通常反映了企业业务系统中的最新操作,同时也是进行数据仓库的基础。
数据仓库ODS层通常采用可靠的数据仓库ETL工具为数据仓库提供数据,以此使源数据和数据仓库之间保持同步。同时,数据仓库ODS层的数据被保存在磁盘中,直接体现了数据仓库的一个特性——非易失性,即在停机或崩溃的情况下,数据不会丢失。

376be55aa105b9ae4311aeaaacf0c98a.png

数仓特点:非易失性

5e653d2e6e179d04fdcc3388adae4164.png

数据仓库CDM层

CDM层是指公共维度模型层,是数据仓库中最核心和最关键的一层。主要用于提供标准化、共享的维度模型,为数据分析提供便利。CDM层通常包括数据明细层(DWD)和数据汇总层(DWS)两个部分。

DWD层指数据明细层,通常接收数据仓库ODS层的原始数据,并进行清洗、标准化、维度退化、异常数据剔除等操作,进行统一处理,为数据分析提供支持。DWD层一般按照业务主题建模,包含多个维度和事实表,维度表可以用来描述业务数据的特征,而事实表则包含了关键数据指标(如销量、价格等)。

DWS层指数据汇总层,其主要作用是通过聚合和汇总,将DWD层中的数据按照主题进行汇总,形成宽表,进而提升数据分析性能。DWS层通常包含多个宽表,每个宽表都是由多个事实表和维度表经过聚合和分组运算生成的。DWS层中的宽表可以满足特定主题和不同维度的分析需求,减少了对其他表的操作,提升数据分析性能。

f7d169ea72d99480ce84d9994f127ed2.jpeg

数仓CDM层工作示例

bec33ed83955df20a307a82f741ec2e0.png

数据仓库ADS层

ADS层也称为数据应用层,其主要功能是保存结果数据,为外部系统提供查询接口,基于数据仓库的数据为企业提供增值应用,并将数据仓库的数据应用于企业决策、报表、分析、控制等领域。ADS层通常采用OLAP(Online Analytical Processing)技术,用于快速访问和查询数据。

ADS层一般包括多个宽表,用于支持与企业应用有关的查询、分析、报告、控制、决策等操作。这些宽表一般可以通过BI工具或自定义应用程序查询和访问,以满足企业的各种数据需求。为了提高访问和查询速度,ADS层通常使用数据索引、缓存和预聚合等技术。

有时为了更好地管理和维护数据仓库,可以将ADS层从数据仓库中独立出去,成为一个独立的数据集市层(Data Mart)。数据集市层专门为某一特定业务需求而建立,可以基于某一个特定的主题或者某个业务领域建模,以满足该领域的数据分析和查询需求。

0e6305f7b111e77b48b85429f4e27125.png

数仓ADS层工作示例

推荐阅读:
被 GPT-4 Plus 账号价格劝退了!
世界的真实格局分析,地球人类社会底层运行原理
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)

企业IT技术架构规划方案

论数字化转型——转什么,如何转?

华为干部与人才发展手册(附PPT)
【中台实践】华为大数据中台架构分享.pdf

华为的数字化转型方法论

华为如何实施数字化转型(附PPT)
华为大数据解决方案(PPT)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据仓库中常见的分层包括三层:采集层(又称为数据源层)、数据存储层和数据应用层。 1. 采集层/数据源层:这一层主要负责从各种数据源获取原始数据,并将其进行清洗、转换和集成,以提供给数据存储层使用。在这一层中,通常会使用ETL(Extract-Transform-Load)工具来实现数据的抽取、转换和加载。 2. 数据存储层:这一层主要负责存储处理后的数据,并提供数据管理和查询功能。数据存储层通常包括数据仓库、数据集市、数据湖等多种形式,以满足不同的数据存储需求。 3. 数据应用层:这一层主要负责将数据存储层中的数据进行处理和分析,并生成各种报表、图表和数据分析结果,以支持业务决策和管理。数据应用层通常包括BI(Business Intelligence)工具、数据挖掘工具、数据分析工具等,以实现数据的可视化和分析。 每一层的作用如下: 1. 采集层/数据源层:负责从各种数据源中采集数据,并对数据进行清洗、转换和集成,以实现数据的规范化和整合。采集层的作用是将各种异构数据源中的数据进行标准化处理,为数据存储层提供高质量的数据。 2. 数据存储层:负责存储处理后的数据,并提供数据管理和查询功能。数据存储层的作用是将采集层处理后的数据存储数据仓库、数据集市或数据湖中,以供数据应用层进行分析和处理。 3. 数据应用层:负责将数据存储层中的数据进行处理和分析,并生成各种报表、图表和数据分析结果,以支持业务决策和管理。数据应用层的作用是将数据可视化和分析,以便用户更好地理解数据并出有意义的决策。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值