第一篇:数据领域重点概念澄清

前言

“数据治理”简简单单四个字却涉及组织、制度、机制、技术、标准等非常多的内容,是一门复杂综合性学科,而且是很多数据类项目的基础性、前置性工作,很多项目或多或少都会涉及到数据治理相关工作,本系列文章主要基于个人学习与实践经验,跟大家系统的聊聊“数据治理”这件事儿!

欢迎大家催更、鼓励,大家的关注将是我持续的动力!

——金子,十年数据领域探索者

第一篇:数据领域重点概念澄清

本篇主要对数据平台、数据治理、数据仓库、数据中台几个我们在数据类项目中经常混淆的概念做一个澄清。

图片

数据平台

数据平台,主要是指一套涵盖数据存储计算、数据处理、数据治理与资产管理、数据服务管理的平台工具。

其中,数据存储计算类工具包括:开源Apache Hadoop生态体系、CDP(Cloudera CDH和Hortonworks HDP整合而来)、星环科技TDH(Transwarp Data Hub)、阿里云MaxComputer(原ODPS)、GreenPlum、TiDB、ClickHouse以及传统关系型数据库等各种数据存储计算类平台工具,在具体使用时可根据不同产品特性和业务需求选择合适工具(后续将专题介绍不同平台工具特性,为大家技术选型提供支撑);

数据处理、数据治理与资产管理、数据服务管理类工具国内主要由目前数据中台类厂商提供的商业套件,包括:阿里云DataWorks、阿里云DataWorks、华为云DGC(原DAYU平台)、数澜科技·数栖平台、百分点BD-OS等,目前市场已逐渐趋向成熟。当然,也可以基于开源组件自己搭建。

数据平台可以作为支撑数据治理、数据仓库、数据中台建设的平台工具,但也仅仅是技术工具,远不能称作数据中台!

数据治理VS数据仓库

数据治理与数据仓库,既相互包含,但实施过程中又各有侧重。其中,数据治理更侧重对整个数据治理体系的建设,包括组织、制度、机制的建设,以及对数据标准、数据质量、数据安全的管控,以为企业提供可信、易用的数据资产;而数据仓库则更侧重数据的分层与数据模型建设,为数据分析提供数据支撑。但是,数据仓库建设有没有包含ETL等数据治理工作,当然有;数据治理包不包含数据分层和数据建模,当然也包含!

数据中台

最后,我们再来看看数据中台。一般我们把数据中台定义为一种持续让数据用起来的机制,而不仅仅一套平台工具,它更强调数据的资产化与资产的服务化,构建一套能持续不断的把数据变成资产并服务于业务的能力,数据服务是标配。

以上观点纯属个人理解,不足之处欢迎大家交流、指正!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值