原文地址:到底什么是数据中台? - 知乎 (zhihu.com)
数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享。如今似乎人人都在提数据中台,但却不是所有人都清楚数据中台到底意味着什么。
一、什么是中台
要回答数据中台是什么,首先要探讨一下中台到底是什么。中台,通过对业务、数据和技术的抽象,对服务能力进行复用,构建了企业级的服务能力,消除了企业内部各业务部门、各分子公司之间的壁垒,适应了企业特别是大型企业集团业务多元化的发展战略。基于中台,可快速构建面向最终消费者和客户的前台应用,从而满足各种个性化特征的前台需求,为企业的数字化转型提供明确的道路。
从技术系统层面看,中台是企业级共享服务平台。传统的IT系统或套件没有太多关注系统能力的复用和共享,因此企业在多年的信息化过程中引入和建设了多套具有重复功能的烟囱型系统。而中台则要求对能力进行细粒度分析,识别共享能力,并将共享能力建设成统一的平台。因此中台不是单系统的服务化。
综上所述,中台是能力的枢纽和对能力的共享。中台是在集中的基础上建设分权的业务,进行联通,并为各业务提供统一的服务。因此一切将企业的各式各样的资源转化为易于前台使用的能力,为企业进行“以用户为中心”的数字化转型服务的平台,都是中台。
二、什么是数据中台
数据是从业务系统产生的,而业务系统也需要数据分析的结果,那么是否可以把业务系统的数据存储和计算能力抽离,由单独的数据处理平台提供存储和计算能力?这样不仅可以简化业务系统的复杂性,还可以让各个系统采用更合适的技术,专注做本身擅长的事。这个专用的数据处理平台即数据中台。
数据中台是一个用技术连接大数据计算存储能力,用业务连接数据应用场景能力的平台。
“连接能力”是数据中台的精髓。作为一个处在中间层的能力平台,“连接”是其根本任务。在业务层面需要尽可能连接各种数据源作为其生产资料;同时,由于生产数据的场景越来越多,覆盖了线上线下等多渠道,各数据生产资料之间也需要进行连接,才能形成全域的数据;数据在数据中台这个平台上按照标准的模型进行规范加工处理后需要服务于多种场景,同样需要我们提供标准的数据服务接口将数据与应用场景连接起来。因此,连接是数据中台的根本能力,也是数据中台的价值所在。
数据中台通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。
数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企业的业务有较强关联性,是这个企业独有且能复用的。
三、数据中台解决什么问题
在数据开发中,核心数据模型的变化是相对缓慢的,同时,对数据进行维护的工作量也非常大;但业务创新的速度、对数据提出的需求的变化,是非常快速的。
数据中台的出现,就是为了弥补数据开发和应用开发之间,由于开发速度不匹配,出现的响应力跟不上的问题。
数据中台解决的问题可以总结为如下三点:
1、效率问题:为什么应用开发增加一个报表,就要十几天时间?为什么不能实时获得用户推荐清单?当业务人员对数据产生一点疑问的时候,需要花费很长的时间,结果发现是数据源的数据变了,最终影响上线时间。
2、协作问题:当业务应用开发的时候,虽然和别的项目需求大致差不多,但因为是别的项目组维护的,所以数据还是要自己再开发一遍。
3、能力问题:数据的处理和维护是一个相对独立的技术,需要相当专业的人来完成,但是很多时候,我们有一大把的应用开发人员,而数据开发人员很少。
这三类问题都会导致应用开发团队变慢。这就是中台的关键——让前台开发团队的开发速度不受后台数据开发的影响。
四、数据中台和数据仓库、数据平台的区别
概括地说,三者的关键区别有以下几方面:
1、数据中台是企业级的逻辑概念,体现企业 D2V(Data to Value)的能力,为业务提供服务的主要方式是数据 API;
2、数据仓库是一个相对具体的功能概念,是存储和管理一个或多个主题数据的集合,为业务提供服务的方式主要是分析报表;
3、数据平台是在大数据基础上出现的融合了结构化和非结构化数据的数据基础平台,为业务提供服务的方式主要是直接提供数据集;
4、数据中台距离业务更近,为业务提供速度更快的服务;
5、数据仓库是为了支持管理决策分析,而数据中台则是将数据服务化之后提供给业务系统,不仅限于分析型场景,也适用于交易型场景;
6、数据中台可以建立在数据仓库和数据平台之上,是加速企业从数据到业务价值的过程的中间层。
五、业务中台和数据中台的关系
业务中台和数据中台作为“两个轮子”并肩构建了数字中台,支撑前台对客户提供从营销推广、转化交易到智能服务业务的闭环服务,促进企业业务的提升和发展。数字中台对内连接企业的后台系统,诸如ERP、人力资源、协同办公、财务管理等。
业务中台抽象、包装和整合后台资源,转化为便于前台使用的可重用、可共享的核心能力,实现了后端业务资源到前台易用能力的转化,为前台应用提供了强大的“炮火支援”,且随叫随到。
数据中台接入业务中台、后台和其他第三方数据,完成海量数据的存储、清洗、计算、汇总等,构成企业的核心数据能力,为前台基于数据的定制化创新和业务中台基于数据反馈的持续演进提供了强大支撑。可以认为数据中台为前台战场提供了强大的“雷达监测”能力,实时掌控战场情况,料敌先机。
从前台应用角度看,业务中台提供的“炮火支援”和数据中台提供的“雷达监测”是一体的,它们一起组成了支撑业务创新的两个“轮子”,缺一不可。
六、数据中台为何如此重要
为什么数据中台如此重要呢,大致有以下四个原因:
1. 回归服务的本质
浙江移动已经将 2000 个基础模型作为所有数据服务开发的基础,这些基础模型做到了 " 书同文,车同轨 "。
无论应用的数据模型有多复杂,总是能溯源到 2000 张基础表,这奠定了数据核对和认知的基础,最大程度地避免了 " 重复数据抽取和维护带来的成本浪费。"
曾经企业的数据抽取就有多份,报表一份,数据仓库一份,地市集市一份,无论是抽取压力、维护难度及数据一致性要求都很高。
同时,统一的基础模型将相关业务领域的数据做了很好的汇聚,解决了数据互通的诉求,这一点意义巨大,谁都知道数据 1+1>2 的意思。
2. 数据中台需要持续的业务滋养
在企业内,无论是专题、报表或取数,当前基本是烟囱式数据生产模式或者是项目制建设方式,必然导致数据知识得不到沉淀和持续发展,从而造成模型不能真正成为可重用的组件,无法支撑数据分析的快速响应和创新。
其实,业务最不需要的就是模型的稳定,一个数据模型如果一味追求稳定不变,一定程度就是故步自封,这样的做法必然导致其他新的类似数据模型产生。
数据模型不需要 " 稳定 ",而需要不断的滋养,只有在滋养中才能从最初的字段单一到逐渐成长为企业最为宝贵的模型资产。
以报表为例,企业报表成千上万的原因往往也是没有沉淀造成的,针对一个业务报表,由于不同的业务人员提出的角度不同,会幻化出成百上千的报表,如果有报表中台的概念,就可以提出一些基准报表的原则。
比如一个业务一张报表,已经有的业务报表只允许修改而不允许新增,自然老报表就会由于新的需求而不断完善,从而能演化成企业的基础报表目录。
否则就是一堆报表的堆砌,后续的数据一致性问题层出不穷,管理成本急剧增加,人力投入越来越多,这样的事情在每个企业都在发生。
3. 数据中台是培育业务创新的土壤
企业的数据创新一定要站在巨人的肩膀上,即从数据中台开始,不能总是从基础做起,数据中台是数据创新效率的保障。
研究过机器学习的都知道,没有好的规整数据,数据准备的过程极其冗长,这也是数据仓库模型的一个核心价值所在,比如运营商中要获取 3 个月的 ARPU(每用户平均收入)数据,如果没有融合模型的支撑,得自己从账单一层层汇总及关联,速度可想而知。
在如今的互联网时代,企业都在全力谋求转型,转型的关键是要具备跟互联网公司一样的快速创新能力,大数据是其中一个核心驱动力。
但拥有大数据还是不够的,数据中台的能力往往最终决定速度,拥有速度意味着试错成本很低,意味着可以再来一次。
4. 数据中台是人才成长的摇篮
原来新员工入职要获得成长,一是靠人带,二是找人问,三是自己登陆各种系统去看源代码,这样的学习比较支离破碎,其实很难了解全貌,无法知道什么东西对于企业是最重要的,获得的文档资料往往也是过了时的。
现在有了数据中台,很多成长问题就能解决,有了基础模型,新人可以系统地学习企业有哪些基本数据能力。
更为关键的是,数据中台让新人摆脱了在起步阶段对于导师的过度依赖,能快速融入团队,在前人的基础上进行创新。数据中台天然的统一、集成特性,有可能让新人打破点线的束缚,快速构筑起自己的知识体系,成为企业数据领域的专家。