在10年前后IT领域主推OA,提出OA的价值是为企业解决信息孤岛、打通各业务或系统的数据通道,而当多年后主推ERP的时候,主推的理由是因为OA系统无法为企业做到信息孤岛的融合,而它能够做到;再到后来的ERP II、信息化、大数据、数据仓库等,以及如今风靡一时的数字化,通过一些资料了解,数字化的主推理由为信息化只是面向业务领域,无法打通信息孤岛的业务痛点,而数字化则是面向决策领域,为解决孤岛等云云。
如今当某企业推出数据中台的概念后,同时说是数仓也存在信息孤岛、数据全量、混乱、不易剥离等各种(不限于此)弊端,而数仓当时推出的时候不就是为了解决此类痛点吗
所以说,对于数据中台的理解越了解越懵。个人感觉或个人理解以下两点,但不知道是不是这样的(接下面评论里,这里放不下了)
1、将之前某个业务需要的5张表合并数据(定期)至一个视图或表里,而这合并后的表数据可能会被一个或多个业务模块调用,就省去了每次都构建这5张表的繁琐,而直接调用合成后的一张表即可(有点类似Kylin,随口一说无需讨论)。这就是我的疑惑,是这样的吗?如果是,那之前我们也有这样做呀,将多张表的数据合并到一个视图中,方便多个地方去调用,想法也是来自于面向对象封装的概念,每次调用都要重复的工作,所以就通过定期将某一业务的多张表数据写到一个视图里了,这种核心的价值体现就是数据中台吗?如果不是,那具体又是怎么样的呢?
2、数据中台即一个概念,并非什么技术。无论是基于大数据还是传统业务数据库,抽离一部分可能引起交集的数据或经常复用的数据进行汇总一张表中,以供多个业务复用。而它构建(抽哪些表)的输入是来自于业务部门或领导层的决策,领导经常需要什么样的数据或业务系统经常会调用哪些数据,基于这些,合并多表数据。
下图为某视频中中台的内容(包括很多讲解中台的视频或文字内容),哪项不是之前做大数据的价值体现哪。sparkStreaming不就是实时处理的嘛。