前言
关于数据中台的构建,虽然今天我们各种相关领域创业公司老板都反复强调技术是次要的,核心是组织+方法论。而组织如何协调、构建的方法论又是咋样的?每个人都说的不一样,又都挺虚无缥缈的,往往很难落地。
我这里想强调,数据中台技术也是蛮重要的,而且是确定性最大的。我们不要一上来就组织变革,伤筋动骨;我们也不要一上来花个几百万,感觉是买了一整套方法论,其实就是买了套一站式数据开发平台。
我们需要守正出奇,深入调研和使用数据中台一站式开发平台,看看我们的业务场景适不适合?数据中台是否能够帮我们做到降本增效?只有这样,我们才能更低成本、更低风险、更高收益的拥抱数据中台,拥抱企业数字化转型。
本文就是专门去讲解数据中台技术篇-一站式数据应用平台的三种构建捷径,相信绝对有一款适合你!!
01
—
DataWorks(完全SAAS化)
DataWorks是阿里云重量级产品,也是公有云产商开放的一站式数据开发平台中做得最好的产品:无论其稳定性、功能的丰富程度、易用性都是最好的。
以下是D
ataWorks的简单介绍:
DataWorks是一个提供了大数据OS能力、并以all in one box的方式
提供专业高效、安全可靠的一站式大数据智能云研发平台。
同时能满足用户对数据治理、质量管理需求,
赋予用户对外提供数据服务的能力。
以下是DataWorks的深入介绍,有兴趣的可以关注:
DataWorks是收费的,除了功能极其受限的按量付费版本外,其他的收费标准如下(由于各地域收费标准有稍微的差异,这里以华东1-杭州区域费用为准):
- 标准版:30,000/年。
- 专业版:60,000/年。
- 企业版:240,000/年。
- 旗舰版:2,000,000/年。
- DataWorks只适用于离线场景,对于实时场景需要再单独购买实时计算服务。整体来说价格还可以,而且阿里云产品账号、鉴权、数据都是打通的,无需自己集成就可以立即使用。
- 正常情况下,基础版就差不多够用了,如果计算任务比较多,可以选择再升级到企业版。对于绝大多数企业,企业版完全能够满足要求。所以,在对比其他类似产品时,千万别被忽悠,以旗舰版的200万/年做为对比的标准,此点切记切记。
- DataWorks是完全SAAS化的,不支持混合部署,这一点要需要有所准备。完全SAAS化指的是企业所有的数据都是在云上的,开发平台也是在云上的;而混合部署是指数据都是在企业本身IDC,而开发工具在云端。对于数据敏感的企业这一点差别需要铭记,但是这里并不是说SAAS化就不安全,混合部署就一定安全,相反阿里云SAAS化安全程度是业内最高的。
- 专业版(官方报价在29.8万/年):适合企业级的开发团队,成员50人以内。支持单环境和双环境模式、作业打包发布和审核、作业基线管理、数据生命周期管理、支持17种数据源、允许创建最大作业数1万个、数据质量告警和基线告警每日合限100次。(最大支持50个集群节点+6个执行代理)。
- 私有化部署版本:价格看具体功能需求点,一般在100万-300万左右,甚至更高。
- 企业本身的数据本身就是在云上的;
- 自己购买EMR;
- 自己购买ECS搭建Hadoop服务。
DataSphere Studio(完全开源)
DSS(DataSphere Studio简称,下文统称DSS)是微众银行自研的一站式数据应用开发管理门户。基于插拔式的集成框架设计,及计算中间件Linkis,可轻松接入上层各种Web系统,让数据开发变得简洁又易用。对于想要自己构建一站式数据开发平台的企业绝对是福音!
之前我有几篇文章分别介绍了如何通过开源社区解决方案构建开源DataWorks,分别包括如下几个开源组件的介绍:- 数据同步:DBus(宜信开源的)。
- 数据开发IDE:Scriptis(微众银行开源的)
- 工作流调度:Easy Scheduler(易观开源的)、Azkaban、Oozie等。
- 数据质量:Griffin(eBay开源的)
- 数据血缘:Data-Hub、Atlas等。
- 需要深入熟悉每个组件的代码,便于做二次开发;
- 需要统一各个组件的前后端技术栈,这块涉及挺多开发工作量的,而且还会涉及到大量代码重构的功能;
- 需要统一账号权限;
- 需要对各个服务做微服务拆分,以及额外功能去掉、模块去除。这些组件中,很多组件都依赖过重,全部部署一套,会消耗大量存储计算资源。而且这么多组件,这么多服务,监控、报警都要搞死你!
- .......
总结
一站式数据开发平台很重要,我想再多强调几次! 我们既要仰望星空,又要脚踏实地,而一站式数据开发平台就是我们能够仰望星空的基础以及前提。 拥有它,我们才能更好的拥抱数据中台,拥抱企业数字化转型。 而如何拥有自己的一站式数据应用平台,根据我们的场景以及数字化的进程,我们要三个不同的选择:- 完全SAAS化:阿里云DataWorks平台;
- 混合部署:云栖平台;
- 完全自主、开源解决:DSS;
从零构建数据中台-基于开源BI工具构建数据可视化精美大屏
从零构建数据中台-强大数据服务能力如何构建(总结篇) 数据中台最核心的代码都在这里了,建议珍藏如何搭建数据中台?众多互联网巨头、行业独角兽手把手教你如何搭建
数据中台2019核心前言-企业数据化转型的加速引擎数据中台行业现状以及供需分析-开篇
账号介绍 忘书:前阿里、滴滴、拼多多Hadoop专家,国内Top3聚焦数据中台领域公司数据中台平台架构师。拥有一整套数据中台构建方法论以及平台快速从零构建能力。个人微信: