数据仓库物理分层_大数据之数据仓库分层 数据组织和管理方法

本文介绍了数据仓库分层的重要性,包括清晰数据结构、减少重复开发、统一数据口径和简化复杂任务。提出了一种通用的分层设计:ODS(原始数据)、DW(数仓中间层)、APP(应用数据)。并详细阐述了各层的功能,如ODS用于存放原始数据,DW打通不同来源数据,APP面向业务定制。数据分层有助于数据仓库的管理和效率提升。
摘要由CSDN通过智能技术生成

大数据之数据仓库分层

什么是数据分层?

数据分层的好处

一种通用的数据分层设计

举例

各层会用到的计算引擎和存储系统

分层实现

数据分层的一些概念说明 7.大数据相关基础概念

1. 什么是数据分层?

数据分层是一套行之有效的数据组织和管理方法,使得数据体系更有序。

2. 数据分层的好处

(1)清晰数据结构

每一个数据分层都有它的作用域和职责,在使用表的时候能更方便的定位和理解。

(2)减少重复开发

规范数据分层,开发一些通用的中间层数据,能够减少极大的重复计算。

(3)统一数据口径

通过数据分层,提供统一的数据出口,统一对外输出的数据口径。

(4)复杂问题简单化

将一个复杂的任务分解成多个步骤完成,每一层解决特定的问题。

一种通用的数据分层设计

ODS:存放原始数据

DW:存放数仓中间层数据

APP:面向业务定制的应用数据

3. 举例

以下是一个电商网站的数据体系设计,只关注用户访问日志这部分数据。

4. 各层会用到的计算引擎和存储系统

5.分层实现

在确定建模思路和模型类型之后,下一步的工作是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值