数据仓库-架构

本文介绍了数据仓库的基本架构,包括操作型系统的数据如何通过ETL过程进入数据仓库,以及RDS和TDS的角色。接着,讨论了主要的数据仓库架构:数据集市(独立和从属)、Inmon的企业信息工厂、Kimball的数据仓库和混合型架构。此外,还详细阐述了操作数据存储(ODS)的作用和特点。
摘要由CSDN通过智能技术生成

基本架构

架构是什么?

在软件行业普遍接受的架构定义是,指系统的一个或多个结构,包括软件的构建,构建外部可以看到的属性以及他们之间的相互关系。

把数据仓库架构理解成构成数据仓库的组件及其之间的关系。

数据仓库架构
如图
在这里插入图片描述
操作型系统由各种形式业务数据组成
这其中可能有关系数据库、TXT、CSV、HTML、XML、还可能有外部系统的数据、网络爬虫等。
数据可能是结构化、半结构化、非结构化的。

这些数据经过抽取、转换、装载(ETL)过程进入数据仓库系统。
抽取过程负责从操作型系统获取数据,该过程一般不做汇总。但是会按照主题进行集成。
物理上是将操作型系统的数据全量或增量复制到数据仓库系统的RDS中。RDS:RAW DATA STORES 原始数据存储。
转换装载过程并将数据进行清洗、过滤、汇总、统一格式化等一系列转换操作,使得数据转为适合查询的格式,然后就将数据装载进入数据仓库系统的TDS中。TDS:TRANSFORMD DATA STORES 转换后的数据存储。
RDS:将原始数据存储到数据仓库中,用户可以查询RDS里的数据而不必影响业务系统的正常运行,起到了操作型数据存储ODS的作用。

TDS:转换后的数据存储,真正的数据仓库中的数据。大量的用户在转换后的数据集上处理他们的日常查询。

在传统数据仓库中,原始数据存储通常是本地文件系统,被组织进相应的目录中,这些目录是基于数据从哪里抽取或何时抽取建立。转换后

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值