元数据管理作为企业数据治理的基础工作,贯穿数据产生、加工和使用的全生命周期,是有效管理和使用数据的基础和前提,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。本文从企业数据应用挑战出发,针对元数据管理发起“灵魂”三问——元数据是什么,有什么用,又该怎么管?
01 企业数据应用挑战
企业在日常经营管理过程中会产生大量的数据,为数据驱动的企业经营管理决策奠定了良好基础,但真正在数据应用时却往往会陷入数据沼泽中,出现数据找不到、读不懂、不可信等问题。
数据找不到。数据分散在不同IT系统和线下文档中,因为缺乏高效的数据搜索工具,业务不知道需要的数据在哪里。
数据读不懂。面对复杂的数据存储结构,因为缺乏对每个数据表、字段的业务含义注释,业务读不懂IT系统中的数据。
数据不可信。数据从产生到消费链路复杂,因为缺乏对数据的全链路追踪,不知道数据来自哪里,都经过了哪些加工,业务无法追溯数据问题。
以上问题主要原因是业务与IT以及业务与业务之间缺乏统一的语言,以及基于统一数据语言的数据搜索和数据追溯能力,即企业统一元数据管理能力。
02 元数据是什么?
何为元数据?
元数据最常见的定义是“关于数据的数据”,非常简单却也不容易理解(哈哈,只能说懂的都懂),所以简单举个栗子:
元数据就是数据的字典或者说明书,比如公司个人档案管理系统数据库中的“180”这一数值单独看我们并不知道是什么意思,但是如果我们赋予了它所属对象“张三”,描述内容“身高”,计量单位“厘米”等信息之后,我们就明白这条数值代表的含义是“张三身高180cm”,则所属对象“张三”,描述内容“身高”,计量单位“厘米”就是180的元数据信息。
元数据分类
元数据贯穿数据流动的全过程,主要包括数据源元数据、数据加工处理过程元数据、大数据平台元数据、应用服务层元数据等。根据元数据用途及针对使用角色的不同&