数据资产入表「第十二讲」-数据治理(一致性设计)

前情提要:数据价值管理是指通过一系列管理策略和技术手段,帮助企业把庞大的、无序的、低价值的数据资源转变为高价值密度的数据资产的过程,即数据治理和价值变现。

上一讲介绍了关联关系建设标准设计的基本逻辑和思路

本章重点讲解数据一致性标准

       当前的数据质量管理标准存在地方的差异性和行业的差异性,但总体围绕(《信息技术 数据质量评价指标》GB/T 36344-2018)展开。

各类数据质量标准清单:

数据一致性定义

       数据一致性:是指数据与其他特定上下文中使用的数据无矛盾的程度。(引用自《信息技术 数据质量评价指标》GB/T 36344-2018)。评价指标包含相同数据一致性、关联数据一致性。

       数据一致性的类型可以按存储维度业务维度两方面划分从存储维度划分包含跨库一致性、跨表一致性、表内一致性;从业务维度划分包含业务内容一致性、业务逻辑一致性、业务内容与元数据一致性;

存储维度划分

       跨库一致性:即同一业务数据在不同的应用场景中面向用户时需要保持一致,且数据发生变化时需要同步被修改,要保障数据更新机制的一致性。针对垮库存储相同数据的一致性要求,需要合理设计数仓更新流程,包括对数仓分层设计的合理性、数据库运维的科学性、数据治理任务调度的流畅度等维度通盘设计和考虑。

       跨表一致性:即同一业务数据在不同的表单中保持一致,此类场景是当同一业务数据在存储过程中被适当冗余时,需要保障在时点上的统一,且数据发生修改时保障数据更新机制的一致性,例如:法人的注册地址在A表和B表同时存在,那么同一主体在两张表之间的内容是否一致。此类过程中需要对同一类型任务的统一管理策略,包含任务的覆盖范围、执行频率、任务触发的时间段等。

       表内一致性:即同一业务数据在表内不同列的逻辑是否保持一致。此类场景是表内不同列之间存在逻辑依赖,例如C字段的逻辑是通过A字段+B字段相加写入,那么要求三列内容在逻辑上保持一致。

业务维度划分

       业务内容一致性:是指相同业务内容在不同系统、不同库表等存储位置,保持数据一致的情况。

       业务逻辑一致性:业务逻辑一致性按照业务内容处理逻辑一致性和关联数据一致性两个维度区分

       ①业务内容处理逻辑的一致性:即同一业务数据在表内不同列的逻辑是否保持一致。参考(表内一致性描述)

       ②关联数据的一致性:是指根据一致性约束规则检查关联数据的一致性。该定义表达的前提是数据模型构建过程中存在表与表之间的关联关系,常见的数据模型包含星型模型、星座模型和雪花模型(业务定义请见附注一)。针对关联数据的一致性则需要考虑数据模型设计的科学性以及数据更新任务的先后顺序(即数据治理任务的依赖关系)。

       业务内容与元数据一致性:《大数据征信 数据描述 数据质量评价规范》 T/MSITISA 03-003.06-2022 团体标准中提出了数据项与元数据一致性,对数据资源管理提出了更明确的要求,要求元数据与业务数据的涵义一致,保障数据在使用过程中的规范性和准确性。为保障数据项与元数据的一致性,则需要从表释义、表业务说明、字段释义、词根管理 等维度搭建一系列的管理制度和流程管理工具。

附注一:

       ①星型模型:星型模型中只有一张事实表,以及0张或多张维表,事实表与维表通过主键外键相关联,维表之间不存在关联关系,当所有维表都关联到事实表时,整个图形非常像一种星星的结构,所以称之为“星型模型”。

       ②星座模型:星座模型也是星型模型的扩展。区别是星座模型中存在多张事实表,不同事实表之间共享维表信息,常用于数据关系更复杂的场景。其经常被称为星系模型。

        3.雪花模型:当一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。

  • 12
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值