华为数据分类管理框架

华为数据分类管理框架

        不同分类的数据,其治理方法有所不同。如基础数据内容的变更通常会对现有流程、IT 系统产生影响,因此基础数据的管理重点在于变更管理和统一标准管控。主数据的错误可能会导致成百上千的事务数据错误,因此主数据的管理重点是确保同源多用、重点进行数据内容的校验等。

结构化数据管理(以统一语言为核心)

结构化数据包括基础数据、主数据、事务数据、报告数据、观测数据、规则数据。结构化数据的共同特点是以信息架构为基础,建立统一的数据资产目录、数据标准与模型。下面将重点介绍六类结构化数据的治理方法。

1. 基础数据治理

        基础数据用于对其他数据进行分类,在业界也称作参考数据。基础数据通常是静态的(如国家、币种),一般在业务事件发生之前就已经预先定义。它的可选值数量有限,可以用作业务或 IT 的开关和判断条件。当基础数据的取值发生变化的时候,通常需要对流程和 IT 系统进行分析和修改,以满足业务需求。因此, 基础数据的管理重点在于变更管理和统一标准管控。

基础数据在支撑场景分流、流程自动化、提升分析质量方面起着关键作用,治理基础数据的价值。

        因此,有效地管理基础数据对企业来说可以产生巨大的收益。华为建立了一个完整的基础数据管理框架, 通过明确各方的管理责任、发布相关的流程和规范以及建立基础数据管理平台等来确保基础数据的有效管理。

                            

2. 主数据治理

        主数据是参与业务事件的主体或资源,是具有高业务价值的、跨流程和跨系统重复使用的数据。主数据与基础数据有一定的相似性,都是在业务事件发生之前预先定义;但又与基础数据不同,主数据的取值不受限于预先定义的数据范围,而且主数据的记录的增加和减少一般不会影响流程和 IT 系统的变化。但是, 主数据的错误可能导致成百上千的事务数据错误,因此主数据最重要的管理要求是确保同源多用和重点进行数据内容的校验。华为的主数据管理策略。

华为的主数据范围包括客户、产品、供应商、组织、人员主题,每个主数据都有相应的架构、流程及管控组织来负责管理。

鉴于主数据管理的重要性,对于每个重要的主数据,都会发布相应的管理规范,数据管家依据数据质量标准定期进行数据质量的度量与改进。

同时,对于主数据的集成消费按照如下管理框架进行管理。

  • 数据消费层:数据消费层包括所有消费数据的 IT 产品团队,负责提出数据集成需求和集成接口实施。

  • 主数据服务实施层:负责主数据集成解决方案的落地, 包括数据服务的 IT 实施和数据服务的配置管理。

  • 主数据服务设计层:为需要集成主数据的 IT 产品团队提供咨询和方案服务,负责受理主数据集成需求,制定主数据集成解决方案,维护主数据的通用数据模型。

  • 管控层:管控层由信息架构专家组担任,负责主数据规则的制定与发布,以及主数据集成争议或例外的决策。

3. 事务数据治理

        事务数据在业务和流程中产生,是业务事件的记录,其本身就是业务运作的一部分。事务数据是具有较强时效性的一次性业务事件,通常在事件结束后不再更新。

事务数据会调用主数据和基础数据。以客户框架合同为例, 核心属性有 32 个,其中调用基础数据和主数据 24 个,占 75% ;客户框架合同本身特有的属性 8 个,占 25%。同时,框架合同也引用了机会点的编码和投标项目的编码等事务数据的信息。

因此,事务数据的治理重点就是管理好事务数据对主数据和基础数据的调用,以及事务数据之间的关联关系,确保上下游信息传递顺畅。在事务数据的信息架构中需明确哪些属性是引用其他业务对象的,哪些是其自身特有的。对于引用的基础数据和主数据,要尽可能调用而不是重新创建。

4. 报告数据治理

        报告数据是指对数据进行处理加工后,用作业务决策依据的数据。它用于支持报告和报表的生成。

用于报告和报表的数据可以分为如下几种:

  • 用于报表项数据生成的事实表、指标数据、维度。

  • 用于报表项统计和计算的统计函数、趋势函数及报告规则。

  • 用于报表和报告展示的序列关系数据。

  • 用于报表项描述的主数据、基础数据、事务数据、观测数据。

  • 用于对报告进行补充说明的非结构化数据。

  • 报告数据涵盖的范围较广,如主数据、基础数据等,这些数据类别本身已经有相应的管理机制和规范,这里我们重点对部分新的细分数据类型进行说明。

事实表:从业务活动或者事件中提炼出来的性能度量。其特点为:

  • 每个事实表由颗粒度属性、维度属性、事务描述属性、度量属性组成;

  • 事实表可以分为基于明细构建的事实表和基于明细做过汇聚的事实表。

维度:用于观察和分析业务数据的视角,支持对数据进行汇聚、钻取、切片分析。其特点为:

  • 维度的数据一般来源于基础数据和主数据;

  • 维度的数据一般用于分析视角的分类;

  • 维度的数据一般有层级关系,可以向下钻取和向上聚合形成新的维度。

统计型函数:与指标高度相关,是对指标数量特征进一步的数学统计,例如均值、中位数、总和、方差等。其特点为:

  • 通常反映某一维度下指标的聚合情况、离散情况等特征;

  • 其计算数值在报告中通常呈现为图表中的参考线。

趋势型函数:反映指标在时间维度上变化情况的统计方式,例如同比、环比、定基比等。其特点为:

  • 通常将当期值与历史某时点值进行比较;

  • 调用时,需要收集指标的历史表现数据;

  • 其计算数值在报告中通常呈现为图表中的趋势线。

报告规则数据:一种描述业务决策或过程的陈述,通常是基于某些约束下产生的结论或需要采取的某种措施。其特点为:

  • 将业务逻辑通过函数运算体现,通常一个规则包含多个运算和判断条件;

  • 规则的计算结果一般不直接输出,需要基于计算结果翻译成业务语言后输出;

  • 规则通常与参数表密切相关。

  • 序列关系数据:反映报告中指标及其他数据序列关系的数据。

5. 观测数据治理

        观测数据是通过观测工具获取的数据,观测对象一般为人、事、物、环境。

相比传统数据,观测数据通常数据量较大且是过程性的,由机器自动采集生成。不同感知方式获取的观测数据,其数据资产管理要素不同。

观测数据的感知方式可分为软感知和硬感知。软感知是使用软件或者各种技术进行数据收集,收集的对象存在于数字世界, 通常不依赖于物理设备,一般是自动运行的程序或脚本;硬感知是利用设备或装置进行数据收集,收集的对象为物理世界中的物理实体,或者是以物理实体为载体的信息,其数据的感知过程是数据从物理世界向数字世界的转化过程。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值