数据仓库-简单shuo


最近做数据分析项目对数据仓库有了一点理解


数据沉淀又叫做资料探勘、数据采矿。它是数据库知识发现中的一个步骤。
数据稽核 稽是考察、稽查,核是审核、核实、核查。

数据稽核的大致思路是通过数据完整性、数据一致性、数据准确性三方面依次 对 DM 层数据进行稽核。






STAGE

层(对应原来数据模型的

SRC

接口层

)

信息模型:

提供业务系统

数据文件的临时存储,

数据稽核,

数据质量保证,

屏蔽对业务系统的干扰,

对于主动数据采集方式,

以文件的方式描述系统与各个专业子系统之间数

据接口的内容、

格式等信息。

与该模型对应的数据是各个专业系统按照该

模型的定义传送来的数据文件。

STAGE

 

是生产系统数据源的直接拷贝,

ETL

过程对数据源进行直接抽

在格式

数据定义

上不作任何改变

与生产系统数据的

唯一不同

是,

STAGE

数据

具有

时间

 

 

 

 

 

STAGE

存在的意义在于

两点

 

1

 

数据源

一次性获取

,数据

仓库

其他部

都依赖

STAGE

的数据,

不再重复

进行抽

也不

在生产系统

上作运算

减小

生产系统的

压力;

 

2

 

生产系统数据

已经刷新

情况

下,

保存

定量的生产系统的

数据,以

便

二次

过程中

运算出错

情况

下可以进行

回溯

 

 

 

2)

 

ODS/DWD

层(对应原模型的

ODS

DW

层)信息模型

简称

DWD

是数据

仓库

细节

数据

是对

STAGE

数据进行

沉淀

减少了

复杂性

ODS/DWD

的信息模型

组织

要遵循企

业业务

处理

式,

各个专业数据进行集中。

业进行

经营

数据的分

系统

据按分

的主

式存

STAGE

粒度一致

于分

公共

源。

 

 

 

3) 

 

 

MID 

信息模型

轻度综合层

模型

增加

的数据

仓库

DWD

层和

DM

之间的

个过

渡层次

,是对

DWD

的生产数据进行

轻度综合和汇总

轻度综合层

DWD

的主

要区

在于

的应

用领域

不同

DWD

的数据来源于生产型系统,

满足

见的

进行

沉淀;

轻度综合层

型应

进行

细粒度

的统

计和沉淀




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值