阿里云Big Data - |分层| ODS& DWD& DWS& ADS| 行为数仓

有基础了解大致情况, 详细请参考原文

 

DW :data warehouse 翻译成数据仓库
DW  数据分层,由下到上为  DWD,DWB,DWS
DWD:data warehouse detail 细节数据层,有的也称为 ODS层,是业务层与数据仓库dao的隔离层
DWB:data warehouse base 基础数据层,存储的是客观数据,一般用作中间层,可以认为是大量指标的数据层。
DWS:data warehouse service 服务数据层,基于DWB上的基础数据,整合汇总成分析某一个主题域的服务数据,一般是宽表。

 

数仓分层

ODS:Operation Data Store
原始数据

DWD(数据清洗/DWI) data warehouse detail
数据明细详情,去除空值,脏数据,超过极限范围的
明细解析
具体表

DWS(宽表-用户行为,轻度聚合) data warehouse service ----->有多少个宽表?多少个字段
服务层--留存-转化-GMV-复购率-日活
点赞、评论、收藏; 
轻度聚合对DWD

ADS(APP/DAL/DF)-出报表结果 Application Data Store
做分析处理同步到RDS数据库里边

数据集市:狭义ADS层; 广义上指DWD DWS ADS 从hadoop同步到RDS的数据

 

1. ODS层

原始数据层,存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。

2. DWD层数据解析

对ODS层数据进行清洗(去除空值,脏数据,超过极限范围的数据,行式存储改为列存储,改压缩格式)

3. DWD层

 1) 商品点击表

2 )商品详情页表

3 )商品列表页表

4 广告表

5 消息通知表

6 用户前台活跃表

7 用户后台活跃表

8 评论表

9 收藏表

10 点赞表

11 启动日志表

12 错误日志表

在数据仓库中,ODSDWDDWS、DM、DIM、DWM和ADS都是一些常见的术语缩写,它们是数据仓库的不同层次或模块,具体含义如下: 1. ODS(Operational Data Store):操作型数据存储层。ODS是数据仓库中的第一层,用于存储从各个业务系统中提取的源数据,该层的数据结构、粒度和格式都与源系统保持一致,是数据仓库中数据处理的第一步。 2. DWDData Warehouse Detail):数据仓库明细层。DWD是数据仓库中的第二层,用于存储经过清洗、集成和加工后的数据,该层的数据结构、粒度和格式都已经进行了标准化和统一,是数据仓库中最主要的数据存储层。 3. DWSData Warehouse Summary):数据仓库汇总层。DWS是数据仓库中的第三层,用于存储对DWD层数据进行聚合、计算和汇总后的结果,该层的数据结构、粒度和格式都已经进行了优化和压缩,是支持数据分析和决策的重要数据源。 4. DM(Data Mart):数据集市。DM是数据仓库中的一个分支或子集,用于针对具体业务需求和分析场景,对DWDDWS层的数据进行再加工和汇总,以支持更精细化和个性化的数据分析和决策。 5. DIM(Dimension):维度表。DIM是数据仓库中的一个重要概念,用于描述业务数据的各种维度属性,如时间、地域、产品、客户等,是数据分析和报表展示的基础和关键。 6. DWM(Data Warehouse Metadata):数据仓库元数据层。DWM是数据仓库中的一个特殊层,用于存储数据仓库中各种对象和元素的定义和描述信息,如表、视图、报表、指标、度量等,是数据仓库管理和维护的基础和关键。 7. ADS(Analytic Data Store):分析型数据存储层。ADS是数据仓库中的一种新型架构,它将ODSDWDDWS三层数据合并到一起,以支持数据分析和决策的实时性和灵活性,是一种适合大数据、实时计算和机器学习的数据仓库技术。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值