《数据定义规范》
上节我们深入分析了痛点产生的原因,并规划了阶段式的整体解决方案,主要是:从 管理组织规范->数据定义规范->建模规范->研发规范->规范化推进 分步骤有序建立数据规范并落地。接下来我们对每个环节进行详细说明,其中“管理组织规范”已经在上节阐述了其必要性和职责范围,本章节就不再赘述了,本节重点放在“数据定义规范”这个环节。
数据定义规范的作用是使得数据在定义上进行规范,各个业务线对该规范达成一致,来更好的进行数据的管理,加速数据定位,消除数据的二义性。
举个例子:数据仓库存在如下两张登录表login_1,login_2,其中两张表均有login_num 这个字段,我的业务需求是按用户名来统计每天的总登录次数,那么我到底是使用login_1还是login_2呢?或是我能直接取已经存在的login_num来作为我需求中需要的指标值吗?不能,因为我所看到的表名称是不规范的,且login_num这个字段到底代表什么含义,也是缺失的,这就是表和指标不规范带来的无法快速定位需要的数据,数据二义性的典范。
整个数据定义规范分为两块:表的规范化定义和指标的规范化定义