数仓dw怎么建_从0到1建设数据仓库——数仓基础篇

本文介绍了数据仓库的基础知识,包括其定义、特点、发展史和架构分层。数据仓库是面向主题、集成、不可更新、随时间变化的数据集合,主要用于分析和决策支持。数据仓库经历了简单报表、数据集市到数据仓库的演进,常见的架构分层包括ODS、DW(DWD、DWM、DWS)和数据应用层。此外,还讨论了数据仓库的表命名规范。
摘要由CSDN通过智能技术生成

数据仓库建设主题是系列篇,目的是带大家从了解数据仓库的基础知识开始,循序渐进,学会数据仓库的建设,本篇是数仓建设的第一篇,主要讲讲数据仓库的基础知识。

01、什么是数据仓库

数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

02、数据仓库的特点

面向主题性

传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻划各个分析对象所涉及的企业的各项数据,以及数据之间的联系。

集成性

数据仓库的数据是从原有的分散的数据库数据抽取来的。操作型数据与DSS分析型数据之间差别甚大。数据进入数据仓库之前,必然要经过统一与综合,这一步是数据仓库建设中最关键、最复杂的一步,所要完成的工作有:

(1)要统一源数据中所有矛盾之处,如字段的同名异义、异名同义、单位不统一、字长不一致,等等。

(2)进行数据综合和计算。数据仓库中的数据综合工作可以在从原有数据库抽取数据时生成,但许多是在数据仓库内部生成的,即进入数据仓库以后进行综合生成的。

不可更新性:

数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作。数据仓库的数据反映的是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值