【大数据】什么是数据中台?

随着企业规模不断扩大、业务多元化——中台服务架构的应运而生。“中台”早期是由美军的作战体系演化而来的,技术上说的“中台”主要是指学习这种高效、灵活和强大的指挥作战体系。阿里在今年发布“双中台+ET”数字化转型方法论,“双中台”指的是数字中台和业务中台。

一、数据中台是什么

数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企业的业务有较强的关联性,是这个企业独有的且能复用的,它是企业业务和数据的沉淀,其不仅能降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在。

广义的数据中台包括了数据技术,比如对海量数据进行采集、计算、存储、加工的一系列技术集合,今天谈到的数据中台包括数据模型,算法服务,数据产品,数据管理等等,和企业的业务有较强的关联性,是企业独有的且能复用的,比如企业自建的2000个基础模型,300个融合模型,5万个标签。它是企业业务和数据的沉淀,其不仅能降低重复建设,减少烟囱式协作的成本,也是差异化竞争优势所在。

更多详细内容,推荐下载:

https://s.fanruan.com/e87g8    

分享专业高效的数据中台建设案例,提供完整中台方案

二、建立数据中台的原因

  • 企业希望数据距离业务更近

以前的数据部门离业务部门有距离,业务部门不能直接使用数据,也不能直接地在数据当中发现价值,业务迫切希望距离数据更近,这是最大的一个需求。

  • 企业希望数据中台能够提供数据服务

过去数据部门提供的都是可视化辅助决策类的服务,而企业希望数据中台能够提供高响应更实时的数据服务。

  • 企业希望数据中台能直接提供业务价值

如何能够让数据直接产生业务价值,是企业非常关心的问题。

  • 企业希望数据中台能够快速开发数据服务

如何能够让数据的开发,利用更快速?

当然,还有其他的期待:

  • 企业希望数据中台和数据能够围绕业务场景来开展工作
  • 提供统一数据

还有诸如:赋能业务更智慧、构建统一数据资产、打通数据孤岛等企业方面的迫切需求。总的来说,很明显能看到企业对于数据中台这个概念承载的重大期待。

三、数据中台的价值

在此基础之上,我们把数据中台抽象成6大价值,在六大能力基础之上支撑的就是数据中台的使命和愿景:构建数据驱动的智能企业。

1.数据资产的规划和治理

现在很多企业在做数字化转型,有的企业还不具备基本的信息化系统,是不是就意味着不需要考虑数据了?或者等数据先有了,把后台建好,再来做中台?

不是这样的。因为数据是无时无刻不在产生的。重要的是:只要业务在生产,或者只要你的业务模式已形成,企业运转起来,你的数据就会时时产生。而且用什么数据也很清晰,区别只是到时候是用人工去处理这些数据,还是用系统去处理这些数据?

所以我们认为数据是不依赖于你的系统是否构建的,它是客观存在的,只是你没有通过技术的手段把它存储,采集下来而已。在这样的情况下,数据要早于应用规划。

构建数据中台,首先要有清晰的数据战略、数据资产的规划。企业需要清晰的知道自己要的是什么数据?现在需要什么数据?未来需要什么数据?可能会产生什么数据?数据未来在哪个系统里面去产生?他们之间的关系是什么?这个很重要。

这就是你要构建的数据资产目录,这个目录是一个逻辑结构,当你清晰的知道了这些结构以后,再去建设你的系统,这样的话,脑子就会非常清晰,只有这样才能从根本上去解决数据质量的问题、数据不一致的问题。

所以我们数据全景图、数据资产目录、数据的战略,这才是企业现在数字化转型的非常重要的第一步。

2.数据资产的获取和存储

数据的全景图,实际上映射的是你的业务全景图。在这个基础之上,构建你的应用,同时采集数据资产。先采集什么数据后采集什么数据?数据之间的关系,采集数据用的工具,这些都是数据平台需要去解决的问题。

3.数据资产的共享和协作

数据资产获取和采集以后,就要去让数据产生新的价值,把数据用起来。

这种情况下,一个非常重要的点是:数据一定要被企业所有的员工,乃至于企业价值链上的所有的人共享、开放和协作。

要让企业的每一个员工都清晰的知道有什么数据,数据的业务含义是什么?数据存放在哪里?只有这样,才不会出现数据的重复建设。如何把业务人员的想法变成数据的产品、协作?如何提高数据创新的速度?

每个企业都需要一个数据资产的协作平台,在这个平台上,业务需求提出人员,数据采集人员、数据开发人员,算法工程师,数据分析工程师,大家能够在一个平台自动化的协作,而不需要线下的这种协作。在同样的版本的数据基础上,用共同的沟通语言去交流协作,这样才能加快企业数据资产开发的速度。

4.业务价值的探索和发现

业务人员提想法,然后在数据资产的这种探索平台里面去做实验,快速的在公有的数据中台的数据集、数据湖的基础之上,构建不同的数据沙箱。用不同的数据版本,去探索和挖掘业务价值。

5.数据服务的构建和治理

当你发现一个数据集对业务很有价值,并且通过了验证以后,就要把它成开发成数据服务,让数据服务能够被更多的人使用。

6.数据服务的度量和运营

有数据开发者,有数据消费者,这样的话就面临一个问题,哪些数据有价值?哪些数据服务有价值?

因为计算资源、存储资源都是有限的,不可能无限制的去开发和存储。所以要识别出有价值的服务,让它被更多的人所使用。让那些没有价值的数据服务,沉淀在底层,然后被销毁和释放。

这就是一个运营体系,让数据能够持续的运营产生价值。只有这6点都具备了,企业才是一个有数据驱动能力的这样的一个智能企业。

 免费试用、获取更多信息,点击了解更多>>>体验FDL功能

了解更多数据仓库与数据集成关干货内容请关注>>>FineDataLink官网

往期推荐:

花10个小时,写出了小白也能看懂的数据分层方法-CSDN博客

什么是数据对接的关键?数据对接有哪些工具?-CSDN博客

全面解析ETL:数据仓库架构中的关键处理过程-CSDN博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值