数仓概念:
- 数据仓库(英语:Data Warehouse,简称
数仓
、DW ),是一个用于存储、分析、报告的数据系统
。 - 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持( Decision Support )。
数仓专注分析
- 数据仓库本身并不“
生产”任何数据,其数据来源于不同外部系统;
- 同时数据仓库自身也
不需要“消费”任何的数据
,其结果开放给各个外部应用使用; - 这也是为什么叫“仓库”,而不叫“工厂”的原因。
数据库为啥不用于进行分析?
答:数仓可以更好的分析数据并展现给用户,而数据库也可以进行分析,但是数据库主要用于增删改,而不是分析。数仓案例:
数仓主要特征:
-
面向主题:主题是一个抽象的概念,是较高层次上
数据综合
、归类并进行分析利用的抽象。 -
集成性:主题相关的数据通常会分布在多个操作型系统中,彼此分散、独立、异构。
需要集成到数仓主题下
。
-
非易失性:也叫非易变性。数据仓库是
分析数据的平台
,而不是创造数据的平台。 -
时变性:数据仓库的
数据需要随着时间更新
,以适应决策的需要。