如何搭建一个数据仓库? 下面大体说明了搭建的流程。
数据仓库的结构
用一幅图来表示:
数据仓库的好处
数据仓库是一套体系。可以建在Oracle上,MySQL上,Hive上,MaxCompute上,具体建在哪个平台根据数据量来定。对数据仓库来说,建在哪个平台不重要,重要的是目的。
数据仓库的目的,是对组织的数据进行统一的治理,归纳来讲,就是:存、通、用。
存:是指数据的统一存储。数据放在一起了,meta才能在一起,便于后续的计算。
通:是指数据的梳理,集中式的数据存储自然而然带来数据的集中管理。便于企业梳理内部的数据,这个是最能刺痛规模比较大,业务比较繁杂的企业的。
用:就是在梳理好内部数据资产后,可以看到那些数据可以做链接。那些业务可以合作。自己还缺少哪些数据。
存偏向于存储,通偏向于数据管理,用偏向于数据计算,也就是业务创新。
业务的野蛮生长总会遇到瓶颈,这个时候就需要有内在驱动的业务创新。数据是指导组织二次创业的好依据。by 山水
主要的流程
简单的来说,就是包括:数据源、ODS、DW(DM)、报告这几部分。
主要有这么几个流程:
数据源到ODS&#x