标题详谈数据仓库
一.数据仓库作用是什么?
数据仓库在设计是有意引入冗余,依照分析需求,分析维度、分析指标进行设计。是面向主题设计的。存储的一般是历史数据,为分析数据而设计。
二.数据仓库的分层和每层的作用
按照数据流入流出的过程,数据仓库架构可分为三层——源数据、数据仓库、数据应用。
-
源数据层(ODS):此层数据无任何更改,直接沿用外围系统数据结构和数据,不对外开放;为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做准备。
-
数据仓库层(DW):也称为细节层,DW层的数据应该是一致的、准确的、干净的数据,即对源系统数据进行了清洗(去除了杂质)后的数据。
-
数据应用层(DA或APP):前端应用直接读取的数据源;根据报表、专题分析需求而计算生成的数据。
为什么要进行分层?
分层是为了在管理数据的时候,能对数据有一个更加清晰的掌控.
屏蔽原始数据影响,清晰数据结构,数据血缘追踪,减少重复开发,把复杂问题简单化