对于一个企业来讲,数据能力的发展我个人总结为了了以下三个阶段
阶段一:数据仓库阶段
数据能力刚刚建起,数据团队开始逐步接入各个业务体系数据,以及设计接入埋点的数据。
面对各方涌入的大量数据,搭建企业级数据仓库,对于数据进行有规划的接入,存储,建模,分析。初步具备数据资产的管理能力,以及面向业务团队的支撑能力。
但是对外的产出大量依赖于人力的获取或者简单的bi查询。
此阶段的重点是:数据同步,数据建模开发。
阶段二:数据平台阶段
随着数据资产体量的不断扩充,数据仓库的逐步稳定,业务团队的需求逐步增加,逐渐苛刻。会面临这人力获取的压力越来越大的问题,急需合理的方案设计来实现计算机算力替代人力进行数据查询。
因此数据能力便进入了一个数据平台化的阶段,标签系统、用户画像系统、用户行为分析系统的产生,使数据的更加精细化、具体化,初步引导业务方向。自主分析平台,多维分析平台的产生,将数据查询的能力平台化,极大程度上解决了人力查询数据的问题,使业务团队能够更加方便、快捷的使用数据。
此阶段的重点是:对数据和业务进行抽象设计,实现标签化及自助服务。
阶段三:数据治理阶段
随着数据体系的逐渐成熟,数据的红利期也逐渐过去,公司对数据的成本投入也逐渐冷静。数据团队不得不得考虑如何降本增效。因此便进入了数据治理的阶段。
数据治理首先需要现有的数据数据资产有一个清晰的认知,具体有哪些数据?哪些表?这数据怎么来的?表之间怎么流动的?数据最后是如何对外产出的?这一系列的问题便抽象出的元数据管理系统,主数据管理系统,数据血缘系统等。
其次数据治理需要考虑如何降本增效,指标管理系统的诞生统一了企业各部门对于数据指标的不同认知,总结出了相对重要的数据指标,并管理了数据指标的生命周期。换言之就是为数据“划了重点”,这样在成本控制时就能够有所轻重。数据质量系统能够进行及时的或周期性的检查监督数据质量,及时发现数据系统中的异常问题并告警,一定程度上减免异常问题的影响。
此阶段的重点是:元数据管理,数据血缘管理,指标管理,数据质量管理,数据成本管理。