转载本文请注明出处:微信公众号EAWorld
01
前言
伴随中国企业数字化转型大提速,2020年5月13日下午,国家发展改革委官网发布“数字化转型伙伴行动”倡议,正式把数字化转型提到国家政策层面。发展数字化转型就避免不了要和数据打交道,数据治理的核心是元数据管理。元数据驱动数字化转型成为趋势,而随着业务系统体量逐渐扩大,对元数据管理、分析提出了新的挑战。及时性、可靠性、可视化等等方面提出了新的要求。
02
元数据分析做什么
首先需要探讨的是什么的问题。元数据分析实践需要做什么?
元数据分析可以做的事情有很多,比如:
1.统计分析,针对整合而来的元数据,提供跨系统、跨BI工具的统计数据。例如:A系统下的表数目统计信息;在一段时间内的表变更情况统计信息;表的使用情况统计等等
2.特征分析,针对整合而来的元数据,进行特征抽取。例如:表的特征信息可以包括总字段数、主键字段数、数值型字段数等等
3.血统分析,针对整合而来的元数据,进行溯源分析,进行以数据流向为主线的血缘追溯。
4.影响分析,针对整合而来的元数据,数据变化会对下游数据产生哪些影响,影响有多大。
03
为什么需要做元数据分析
通过元数据分析帮助我们识别元数据价值,提升企业数据可信度,为企业的数据融合提供质量保证,帮助业务部门和IT支撑部门实现信息共享、提升工作效率。
04
普元的元数据分析实践
①普元在XX物流公司的实践
实践背景:
•公司的数据集成依托于PowerCenter;
•数据服务提供依靠大量的存储过程以及视图完成其复杂的业务信息需求;
现实问题:
对数据服务的维护需要同时维护成百上千的PC模型文件以及存储过程。当数据服务出现变更需求或者出现数据 质量问题维护的同时需要人工查阅文件,重新梳理数据流转过程,极大的影响了办公效率以及办公质量。
解决方案:
•实现对PowerCenter、以及存储过程、视图元数据采集
•实现PowerCenter、以及存储过程、视图元数据的自动关联,形成血缘脉络
普元元数据系统支持常见的关系型数据库(Mysql、Oracle、S