数据仓库灵魂30问之数据仓库、数据中台、数据湖有什么区别

先说结论:
数据仓库实行分而治之,面向BI(商业智能);
数据中台实行一统天下,面向DateAPI(数据服务API);
数据湖实行无为而治,面向AI(人工智能)。

他们三个实行的策略不同,用途不同。但是数据中台可以包容数据仓库与数据湖,数据湖与数据仓库是并存的。

接着我从为什么建立他(目的),建立他需要什么(成本),可以带来什么(收益)三方面来讨论。

数据仓库

  • 目的
    实现跨业务条线、跨系统的数据整合,为管理分析和业务决策提供统一的数据支持。也就是数据仓库主要用于为公司决策者提供决策支持,当然也可以为生产环境存储数据。
  • 成本
    硬性成本较低,软性成本较高。需要一个团队分别去对接业务,打通孤岛,维度建模等等。做出来很简单,哪怕一个初高级数据仓库工程师也可以完成,但是如何让仓库用的方便快捷,适应公司发展就需要投入大量成本。
  • 收益
    消灭公司数据孤岛,让决策层可以随意调用公司数据,可以为公司战略提供数据支持。让业务部门便捷的获得数据,大大提高了业务部门的战斗力。

数据中台

  • 目的
    盘活公司的数据,标志着转型为DT时代企业,可对外提供数据服务,降低冗余,降低成本,为公司未来智能化打下铺垫。
  • 成本
    成本极高,目前国内有中台建设经验的团队也没有多少,而且中台不是适应所有的公司,只为了建设中台而建设中台只有两种结果:建设了一个四不像与死亡。张勇也说过:“如果一个企业奔着中台做中台,就是死。”
    适合自己的才是最好的,强求不得。
  • 收益
    中台的建设完成就相当于给公司加了一个最起码三倍"大龙的buff",极大的降低公司开发周期(减CD),数据共通更极大的增强了公司的健壮性(加HP最大值),而且对同行竞争对手有压制作用(范围属性压制),因为降低了冗余可以保证公司的输出能力(加MP最大值)等等。

数据湖

  • 目的
    实现数据的集中化管理,加强公司深度学习,数据挖掘能力,优化运营模型。

  • 成本
    建立数据湖的可能性与建立数据沼泽的可能性的比例大概是1:10。数据湖对于数据湖总架构师与数据科学家有极高的要求,两者缺一不可。
    要不然建设出来的数据湖就会是沼泽,没有一点用而且恶臭无比。

  • 收益
    因为数据湖的集中化管理,第一必然是数据治理,其次是深度学习与数据挖掘的发展会让公司孕育出预测分析、信息追踪、推荐引擎甚至是真正的商业模型。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寒 暄

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值