主数据定义:全域统一、可重复利用价值高的数据。 该数据在各系统间共享,具有权威性。
特点:主数据是非事务性的数据,一般更改没那么频繁,是长期有效的;一般是数仓中经治理后的维表。
主数据的识别规则:
1、主数据能与其他数据交互,一般是维表
2、主数据有生命周期,能增删查改
3、数据量要能达到一定基数
4、长期有效的
5、有一定的复杂性且对企业存在价值
6、相对事务性数据变化较少,但也不是完全不变。完全不变的不能是主数据
7、主数据可作为服务跨系统共享
主数据管理系统:制定数据标准规范、对数据的全生命周期进行管理
主数据管理系统一般涉及如下功能:
- 主数据:数据标准的定义(增删改查等操作,表/字段属性及含义等)
- 数据集成整合:支持各类型数据的接入、定义抽取规则;也可手动录入
- 数据质量控制:各种数据校验规则的定义与应用、校验结果的统计展示
- 数据共享:将主数据以api等方式对外共享,有api配置及权限管理能力
- 数据资产:维护数据资产目录、数据资产目录检索及分析功能
- 数据生命周期管理:创建->审批->发布->修改->失效整个过程的管理,同时展示数据间的血缘关系,按部门的数据权限管理。