美团:踩雷好几年,才总结出的数据治理避坑攻略

一、序言

美团住宿数据治理团队通过多年数仓建设及数据治理的经验沉淀,并结合业务发展阶段对于数据治理的诉求,将治理的思路逐步从专项、表象、问题驱动的治理,转变为自动化、体系化的治理,并从标准化、数字化、系统化三个方向进行了落地与实践。

二、背景介绍

美团住宿业务从2014年上线之后发展多年,历经探索期、进攻期,发展期,并逐步由发展期向变革期过渡。业务从之前的快速扩张阶段进入相对稳定的发展阶段,运营手段转变为精细化运营,同时对数据的成本、效率、安全、价值等方向的要求也越来越高,这些都对数据治理提出了新的要求。

图1 住宿业务发展阶段

另一方面,住宿数据组所属的数据中心内部有住宿、门票度假等多条业务线,各业务线业务模式不同,所处业务生命周期阶段不同,在数据治理上的认知及经验积累也不同。如何能将数据治理经验及能力高效复用,使数据中心各业务线在数据治理的效率和效果上都能稳步提升,避免踩坑,这就需要数据治理更加标准化、体系化、自动化。

此前,我们在数据治理上已经有了一些积累和沉淀,前一阶段主要从单点、被动的治理转变为主动、专项的治理,治理动作有意识、有规划,也有一定的针对性,且取得了一定的成果,但总的来说仍以问题驱动治理、凭经验治理为主。面对新的数据治理责任及要求,过往的方式存在着一些问题,主要包括以下几个方面。

1.治理认知差异大

认知不一致,思路不统一:治理缺乏通用的体系指引,不同的治理人对于数据治理的认知深度、问题拆解的方式、治理的思路步骤、采取的方法及其效果追踪等方面,都存在较大的差异。

  • 重复治理、信息不通:治理不彻底、治理经验缺乏沉淀,同样的治理,不同的人反复实行。
  • 范围交叉、边界不清、效果难评估:不同的人针对不同的问题成立不同的专项进行治理,问题的底层逻辑有交叉。有的治理没做什么动作,反而收到了较好的结果,有的治理对于结果说不清。

2.治理方法不标准

  • 流程规范缺失:对于每个方向、每类问题的治理缺少理论指导,治理的方法、动作、流程、步骤依赖治理人的经验和判断。
  • 问题难度量追踪:治理的问题缺少衡量标准,更多靠人为来进行判断,治理效果缺少评估体系。
  • 解决方案难落地:解决方案存在于文档中,需要治理人查找理解,缺少工具支撑,成本较高。

3.治理效率低、效果差

  • 治理线上化程度低:治理依赖的资产信息、治理动作都分散于多个系统中,信息碎片化,执行效率低。
  • 过程无法标准化,结果无保障:治理过程需要治理人来“人为保障”,存在理解偏差和执行偏差。

4.数据管治缺乏体系化

  • 缺乏整体顶层治理方案设计:业务及数据中心对于数据治理的要求,需要治理更全面、更精细、更有效,需要治理的体系化,需要从宏观角度进行思考,层层拆解,需要从整体、从顶层来做方案设计。
  • 问题越来越复杂,单点难解决:过往更多的是从表象去解决问题,从表面来看衡量指标有改善,实际是“头痛医头、脚痛医脚”,并没有从根本上解决问题。或者多个问题具有共性,根本问题是一致的。比如查询资源紧张的根本,可能是分析主题模型建设不足或运营不够。
  • 不同问题的优先级无法确定:不同问题的优先级缺乏衡量标准和方法,主要靠人为判断。
  • 治理不符合MECE原则:每个治理方向由哪些问题组成,哪些最重要,哪些的ROI最高,哪些问题和治理动作可以合并,同一问题在数仓不同主题、不同分层的衡量标准和治理方法应该有哪些差异,都需要在体系化治理中进行考虑。

三、治理体系化思考

从上述背景中不难看出,我们面临着不同业务生命周期阶段对数据建设和治理不同的要求及挑战,同时过往更多的以被动治理、问题驱动的专项治理方式方法也比较落后,这直接导致技术团队很难满足业务方对于财务、业务支持等方面的要求。

通过不断的汲取教训和总结经验,我们开始意识到数据管治是一个非常复杂的综合性问题,只有构建出一套标准的业务数据管治体系,才能确保数据治理在现状评估、目标制定、流程规范建设、治理监控管理、能力建设、执行效率、效果评价等各环节有效落地。下面介绍一下我们在治理体系化层面的理解和思考。

1、什么是数据治理体系化?

针对数据管理和治理,我们期望搭建一套集管理体系、方法体系、评价体系、标准体系、工具体系等核心能力的组合,持续服务于数据管治实施。可以类比一般的电商公司,如果需要运转并服务好顾客,它首先必须搭建起来一套销售体系、产品体系、供给体系、物流体系、人力体系等等,只有这样才可以相互配合,实现服务好用户这一大目标。

图2 数据治理体系思考

2、数据治理体系化如何解决目前治理存在的问题?

1)方式方法上

先做顶层治理框架设计,从团队整体视角定义和规划好治理的范围、人员、职责、目标、方法、工具等必须部分,再进行落地。更关注整体策略的普适性及有效性,而非深陷某个具体问题解决方案开始治理。

2)技术手段上

以完善的技术研发规范为基础,以元数据及指标体系为核心,对业务数仓和数据应用进行全面评价和监控,同时配套治理系统工具,帮助治理同学落地治理策略和解决数据开发同学治理效率低问题。

3)运营策略上

通过对待治理问题进行影响范围、收益情况进行评估,确定待治理问题的重要度,从管理者视角以及问题责任人视角2个途径推动不同重要程度的治理问题解决。

3、业务数据管治体系框架如何建设?

我们的建设思路是:以团队数据治理目标为核心导向,设计实现目标需要的相关能力组合,并根据组织要求,实施过程的问题反馈,持续不断地迭代完善,最终实现数据治理的愿景。

体系框架主要包含以下内容:

  • 管理层

立法,制定相关的组织保障流程规范、职责设计、奖惩措施,指导和保障数据治理顺利进行,这是数据治理能够成功启动运转的关键因素。

  • 标准层

设标准,制定各类研发标准规范、解决方案标准SOP等数据治理过程中需要的各类技术规范和解决方案,这是所有技术问题正确与否的重要依据,也是治理中事前解决方案必不可少的一部分。完善的标准规范和良好的落地效果,可很好地降低数据故障问题的发生量。

  • 能力层

完善能力,主要是基于元数据的问题度量的数字化能力,以及问题工具化检测和解决的系统化能力。数字化和系统化能力是数据治理实施的科学性、实施的质量及效率的重要保障。

  • 执行层

设定动作,结合要达成的具体目标,对各治理域问题,按照事前约束、事中监控、事后治理的思路进行解决。目标的达成,需要拆分到7大治理域相关的具体问题中去落地。因此,一个治理目标的达成,很依赖治理域对问题描述的全面性及深度。

  • 评价层

给出评价,基于指标的问题监控,健康度评价体系,专项评估报告,评价治理收益及效果,这是实施治理推进过程监控,结果检验的重要抓手。

  • 愿景

长期治理目标,指导数据管治有方向地不断朝着最终目标前进。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值