数据仓库背景
数据仓库是应数据分析BI平台而起来的,最初的数据仓库,包含集成不同数据源的数据,形成统一的数据模型,提供给报表平台生成报表,以及提供查询分析功能,后来,数据仓库也作为数据源,对第三方平台提供数据,作为一个数据存储中心,也有一些互联网平台利用数据仓库作为数据源,通过算法,将数据推送至用户端,进行营销或者数据推送,可以说数仓的经历是 存储->分析->使用的过程,当用于营销的时候,就直接产生了价值,而现在有些数据需要购买,也会产生经济价值。
数仓模块
数仓作为一个系统,是一系列组件构成的,每个部分各司其职,划分如下:
-
数据仓库
-
报告分析系统
-
固定格式图表
-
自定义分析
-
推送报告
-
-
指标管理系统
-
指标定义
-
指标计算
-
指标查询
-
-
数据建模系统
-
概念模型
-
逻辑模型
-
物理模型
-
-
数据存储系统
-
关系型数据库
-
多维数据库
-
-
ETL系统
-
从不同数据源提取数据
-
根据规则转换处理数据
-
加载数据到存储库
-
-