数据治理系列文章:(3)数据标准

     数据标准,从字面上就能理解其含义,即针对数据的标准,目前通用的定义解释是指企业为保障数据的内外部使用和交换的一致性和准确性而制定的规范性约束,而数据标准管理则是一套由管理制度、管控流程、技术工具共同组成的体系,是通过这套体系的推广,应用统一的数据定义、数据分类、记录格式和转换、编码等实现数据的标准化。

     但具体到数据标准的范围、内容,可能很多人讲不清楚,虽然网络上有很多关于数据标准的文章,介绍的内容很丰富,体系脉络也很清晰,但这些文章理论方法过重、边界不够明确,读完之后,实在是难有大的收获和深入理解,并且容易造成自身认知体系的混乱,比如说数据标准、主数据、元数据、数据指标,这些概念本来是独立且关联的,但把它们揉在一起来讲解,对于刚接触数据治理的朋友而已,这样往往让人认知更为混乱!所以,这里我对数据标准的介绍不会做太多发散和概念延申,而是侧重实战,从项目的落地性来聊聊数据标准。

    数据标准成为数据治理的一个基础模块,是有其存在的重要意义的,因为数据治理的本质就是将分散、杂乱、无序的数据,变成清晰、高质、易用的数据资产,而统一的标准规范则是一切数据治理活动的基础,有了统一的标准,各项治理工作才能顺利推进。

  1. 数据标准能为各数据治理团队、人员提供统一的基础约束,保障数据治理的统一规范,避免混乱;
  2. 数据标准是数据治理成果评价的重要依据;
  3. 数据标准是数据资产运营管理的重要抓手;
  4. 数据标准是保障数据高效流转的基础。

数据标准从概念定义来讲,涵盖的内容较多,但是从工程项目落地角度来说,一般涵盖有词汇标准、字段标准、命名标准、标准稽核等几大方面。

  1. 词汇标准

      词汇标准是数据标准的基础,我们要描述各类数据,就需要去对数据进行释义,词汇自然就是释义的基础。不同行业的基础词汇标准定义是有所差异的,甚至同行业不同企业的词汇标准也可能有所不同,词汇标准的制定需要充分考虑企业现有的词汇定义,再结合业务特性,进行抽象提取,形成适合企业自身的词汇标准。

      词汇标准的制定,应遵循不可分割性、唯一性、通用性等原则,选择细颗粒度的基础词汇来构建,如下图所示,词汇标准一旦制定就应该成为全企业共同的遵循。

     词汇标准的制定需要一套规范流程,从一线人员提出、专业人员评议、管理者审核,最终上线,成为标准(这个流程会内嵌到数据治理组织架构体系的建设中去)。

  1. 字段标准

      字段标准是强业务性的标准,是以词汇标准为依据进一步构建的贴近业务的数据标准,标准字段的定义需要充分结合现有的数据字段情况,抽象提炼成企业共享共同的字段标准(参考下图示例),字段的命名、类型、长度、类型、敏感级别等信息都是字段标准制定过程中需要考虑的,基于这些维度构建起的字段标准,将成为数据治理各环节的共同遵循和依据。

  1. 命名标准

     命名规范一般都是遵循IT行业通用的数据库命名规范,只要做过开发的,基本都知道,所以这里没有太多需要讲解的!

  1. 标准稽核

      数据标准落地情况的稽核有两种情况,一种被动式的稽核,即在数据治理开发过程中,被动触发数据标准稽核,比如模型命名时,对不符合数据标准的命名进行报错,约束模型的命名符合规范;另外一种是主动式稽核,即创建稽核任务,对特定数据资源进行相关标准的稽核。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值