从ODS-DWD-DWS-ADS详解数仓分层设计架构

这是一张典型的数据仓库架构图。按自下而上的顺序,分别为数据仓库ETL(Extract-Transform-Load)层、ODS(Operational Data Store)层、CDM(Common Dimensional Model)层和ADS(Application Data Store)层。其中CDM层主要包括DWD层(Data Warehouse Detail)和DWS层(Data Warehouse Summary)两部分。

84361b3bc9009ecbe68b7acea5c6b060.jpeg数据仓库架构图

一、数据仓库ETL/ELT

数据仓库ETL主要用于完成数据接入的过程,即从业务系统或其他数据源中提取数据,并进行数据清洗、转换和加载到目的地系统(如数据仓库)中的过程。该过程中,数据会经历抽取(Extract)、转换(Transform)和加载(Load)三个阶段,最终达到数据从源头流动到目标端的目的。

数据仓库ELT指的是将数据抽取出来后,直接进行加载,最后再进行数据转换的一种数据集成和处理方式。与传统的 ETL不同,ELT将数据的处理和加工过程转移到了数据仓库中,利用数据仓库的数据计算能力和分布式处理能力来处理和转换数据。

ETL遇到的挑战

具体来说,数据抽取是指从源数据系统中提取数据到目标数据系统,一般可以通过现成的工具来完成,如Sqoop、Kettle等。数据转换是指将抽取的数据进行清洗、标准化、加工等操作。这里需要注意的是,对于非结构化或半结构化数据,由于数据格式多样化、标准化难度较大,因此可能需要花费一些时间进行数据清洗和处理。

FineDataLink是一款ETL工具,支持三十多种格式和结构的异构数据源,可以将这些异构数据源集成到一个统一的数据仓库中,并进行清洗、转换和分析,显着降低开发人员、数据分析师和研究人员的工作量,提高数据处理的效率和准确性,帮助企业更好地管理和分析数据。

2aa18e05d612b2d392fb8209b7fb74b5.jpegFineDataLink的数据转换功能

最后,数据加载是将经过转换处理后的数据加载到目标系统中,一般也会采用现成的工具来完成,如Informatica、ODI等。

652f5adf6f042bd1eed50c1049ca958e.jpegETL流程

示例中提到的数仓工具分享给大家——
https://s.fanruan.com/8j9is
零基础快速上手,还能根据需求进行个性化修改哦

二、数据仓库分层

1、数据仓库ODS层

数据仓库ODS层也称为操作数据源层,是数据仓库中的一个核心组成部分。该层主要用于保存原始数据,完成数据积存,通常反映了企业业务系统中的最新操作,同时也是进行数据仓库的基础。

数据仓库ODS层通常采用可靠的数据仓库ETL工具为数据仓库提供数据,以此使源数据和数据仓库之间保持同步。同时,数据仓库ODS层的数据被保存在磁盘中,直接体现了数据仓库的一个特性——非易失性(完整参见文章《数仓扫盲系列(1):数据仓库之基本概述》),即在停机或崩溃的情况下,数据不会丢失。

ed33fbb43775e37f8c5671cb81fdf557.jpeg数仓特点:非易失性

FineDataLink有数据同步功能,可以通过定义数据来源和数据去向,实现数据表的跨数据库数据传输。

913ab036879ce6e226255447338ce93b.jpegFineDataLink数据同步

FineDataLink还有数据管道功能,可以通过MySQL binlog、Oracle LogMiner、和SQL Sever的CDC等日志解析,来实现增量数据实时同步。

90b4f096428c19a4e6136546910e1da8.jpegFineDataLink数据管道

2、数据仓库CDM层

CDM层是指公共维度模型层,是数据仓库中最核心和最关键的一层。主要用于提供标准化、共享的维度模型,为数据分析提供便利。CDM层通常包括数据明细层(DWD)和数据汇总层(DWS)两个部分。

DWD层指数据明细层,通常接收数据仓库ODS层的原始数据,并进行清洗、标准化、维度退化、异常数据剔除等操作,进行统一处理,为数据分析提供支持。DWD层一般按照业务主题建模,包含多个维度和事实表,维度表可以用来描述业务数据的特征,而事实表则包含了关键数据指标(如销量、价格等)。

DWS层指数据汇总层,其主要作用是通过聚合和汇总,将DWD层中的数据按照主题进行汇总,形成宽表,进而提升数据分析性能。DWS层通常包含多个宽表,每个宽表都是由多个事实表和维度表经过聚合和分组运算生成的。DWS层中的宽表可以满足特定主题和不同维度的分析需求,减少了对其他表的操作,提升数据分析性能。

df32fd6359d2ed452e557313b1e370bc.jpeg数仓CDM层工作示例

2、数据仓库ADS层

数据仓库ADS层也称为数据应用层,其主要功能是保存结果数据,为外部系统提供查询接口,基于数据仓库的数据为企业提供增值应用,并将数据仓库的数据应用于企业决策、报表、分析、控制等领域。数据仓库ADS层通常采用OLAP(Online Analytical Processing)技术,用于快速访问和查询数据。

数据仓库ADS层一般包括多个宽表,用于支持与企业应用有关的查询、分析、报告、控制、决策等操作。这些宽表一般可以通过BI工具或自定义应用程序查询和访问,以满足企业的各种数据需求。为了提高访问和查询速度,ADS层通常使用数据索引、缓存和预聚合等技术。

有时为了更好地管理和维护数据仓库,可以将ADS层从数据仓库中独立出去,成为一个独立的数据集市层(Data Mart)。数据集市层专门为某一特定业务需求而建立,可以基于某一个特定的主题或者某个业务领域建模,以满足该领域的数据分析和查询需求。

1d98e208c2561c9a2c767d7b6c0972ba.jpeg数仓ADS层工作示例

三、数据仓库搭建

下面这份PPT介绍了企业数据仓库建设解决方案,内容包括数据仓库架构、数仓建设关键动作、数仓载体/工具、配置参考、大数据场景支撑案例等内容。

d00caea1bbe2abc220a14c35ca6f0c95.jpegdb399f71239e0ea941d8dbea01aa5d2f.jpeg95e675bd83487ad68640d4bb14c8c3e7.jpegf670841a6ecf4e99d17424f9950e8d17.jpeg67291bc9a6cee9d68cd5809f7f97897b.jpeg

四、结语

帆软软件深耕数字行业,能够基于强大的底层数据技术,为企业打破数据孤岛,搭建数据仓库,梳理指标体系。为并企业提供数据仓库的上层应用生产力,结合强大的数据产品,建立全面、便捷、直观的经营、财务、绩效、风险和监管一体化的报表系统数据分析平台,并为各业务部门人员及领导提供PC端、移动端等可视化大屏查看方式,有效提高工作效率与需求响应速度。

示例中提到的数仓工具分享给大家——
https://s.fanruan.com/8j9is
零基础快速上手,还能根据需求进行个性化修改哦

  • 26
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
数据仓库中,ODSDWDDWS、DM、DIM、DWM和ADS都是一些常见的术语缩写,它们是数据仓库的不同层次或模块,具体含义如下: 1. ODS(Operational Data Store):操作型数据存储层。ODS数据仓库中的第一层,用于存储从各个业务系统中提取的源数据,该层的数据结构、粒度和格式都与源系统保持一致,是数据仓库中数据处理的第一步。 2. DWD(Data Warehouse Detail):数据仓库明细层。DWD数据仓库中的第二层,用于存储经过清洗、集成和加工后的数据,该层的数据结构、粒度和格式都已经进行了标准化和统一,是数据仓库中最主要的数据存储层。 3. DWS(Data Warehouse Summary):数据仓库汇总层。DWS数据仓库中的第三层,用于存储对DWD层数据进行聚合、计算和汇总后的结果,该层的数据结构、粒度和格式都已经进行了优化和压缩,是支持数据分析和决策的重要数据源。 4. DM(Data Mart):数据集市。DM是数据仓库中的一个分支或子集,用于针对具体业务需求和分析场景,对DWDDWS层的数据进行再加工和汇总,以支持更精细化和个性化的数据分析和决策。 5. DIM(Dimension):维度表。DIM是数据仓库中的一个重要概念,用于描述业务数据的各种维度属性,如时间、地域、产品、客户等,是数据分析和报表展示的基础和关键。 6. DWM(Data Warehouse Metadata):数据仓库元数据层。DWM是数据仓库中的一个特殊层,用于存储数据仓库中各种对象和元素的定义和描述信息,如表、视图、报表、指标、度量等,是数据仓库管理和维护的基础和关键。 7. ADS(Analytic Data Store):分析型数据存储层。ADS数据仓库中的一种新型架构,它将ODSDWDDWS三层数据合并到一起,以支持数据分析和决策的实时性和灵活性,是一种适合大数据、实时计算和机器学习的数据仓库技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Leo.yuan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值