导读
数据字典作为数据治理整体体系中重要的一环,理解和使用数据字典尤为重要。本文将从数据字典概念、定义、结构、应用、治理等方面进行详细阐述。
01概念
数据字典(Data Dictionary)是一个容器,用于包含有组织定义和使用的所有数据元素的信息。它旨在管理、维护、分析企业中各种数据元素及其相关信息。它提供了一种集中管理和查询组织数据资源的方式,可避免重复定义已有数据元素,提高数据质量和减少数据错误,同时可基于数据字典相关属性分析,使得数据资源整体降本增效。
02定义
数据字典集中对数据库表字段进行定义与描述,它将文档型数据字典做了线上化管理,可实现客户各系统库表字段信息、表分类/表描述、字段标准映射等信息的维护,便于系统间数据信息共享。
数据字典可借助元数据的能力,可实现获取各业务系统、大数据平台库表字段等诸多信息,例如表字段级血缘、数据质量监控告警规则、数据安全等级、字段加密、数据表字段与指标、标签、报表关联关系。同时可基于数据表计算消耗与存储属性,结合一定规则策略,实现提升性能优化资源的目的。
不少朋友可能对数据字典、数据模型、数据库三者的定义有所混淆,以下展示了三者的区别。