元数据管理
定义和描述其他数据的数据
定义.
- 通过计划、实施和控制活动确保访问到高质量的、整合的元数据
目标
- 激励和管理与数据相关的业务术语知识体系,以确保人们理解和使用数据内容的一致性
- 收集和整合来自不同来源的元数据,以确保人们了解来自组织不同部门的数据之间的相似性和差异
- 确保元数据的质量、一致性、及时性和安全
- 提供标准途径,使元数据使用者(人员、系统和流程)可以访问元数据
- 推广或强制使用技术元数据标准,以实现数据交换
业务驱动因素
- 通过提供上下文语境和执行数据质量检查提高数据的可信度
- 通过扩展用途增加战略信息(如主数据)的价值
- 通过识别冗余数据和流程提高运营效率
- 防止使用过时或不正确的数据
- 减少数据的研究时间
- 改善数据使用者和IT专业人员之间的沟通
- 创建准确的影响分析,从而降低项目失败的风险
- 通过缩短系统开发生命周期时间缩短产品上市时间
- 通过全面记录数据背景、历史和来源降低培训成本和员工流动的影响
- 满足监管合规
原则
- 组织承诺
- 战略
- 企业视角
- 潜移默化
- 访问
- 质量
- 审计
- 改进
元数据类型
业务元数据
主要关注数据的内容和条件,另包括数据治理相关的详细信息
- 数据集、表和字段的定义和描述
- 业务规则、转换规则、计算公式和推导公式
- 数据模型
- 数据质量规则和核验结果
- 数据的更新计划
- 数据溯源和数据血缘
- 数据标准
- 特定的数据元素记录系统
- 有效值约束
- 利益相关方联系信息
- 数据的安全/隐私级别
- 已知的数据问题
- 数据使用说明
技术元数据
提供有关数据的技术细节、存储数据的系统以及在系统内和系统之间数据流转过程的信息
- 物理数据库表名和字段名
- 字段属性
- 数据库对象的数据
- 访问权限
- 数据CRUD(增删改查)规则
- 物理数据模型(表名、健、索引)
- 记录数据模型和实物资产之间的关系
- ETL作业详细信息
- 文件格式模式定义
- 源到目标的映射文档
- 数据血缘文档,包括上下游变更的影响的信息
- 程序和应用的名称和描述
- 周期作业(内容更新)的调度计划和依赖
- 恢复和备份规则
- 数据访问和权限、组、角色
操作元数据
描述处理和访问数据的细节
- 批处理程序和作业执行日志
- 抽取历史和结果
- 调度异常处理
- 审计、平衡、控制度量的结果
- 错误日志
- 报表和查询的访问模式、频率、执行时间
- 补丁和版本的维护计划和执行情况,以及当前的补丁级别
- 备份、保留、创建日期、灾备恢复预案
- 服务水平协议(SLA)要求和规定
- 清洗标准
- 数据共享规则和协议
- 极速人员的结算、职责、联系信息
ISO/IEC 11179元数据注册标准
- 数据元素生成和标准化框架
- 数据元数据分类
- 数据元素的基本属性
- 数据定义的形成规则和指南
- 数据元素的命名和识别原则
- 数据元素的注册
元数据来源
- 应用程序中的元数据存储库
- 业务术语表
- 商务智能工具
- 配置管理工具
- 数据字典
- 数据集成工具
- 数据库管理和系统目录
- 数据映射管理工具
- 数据质量工具
- 字典和目录
- 事件消息工具
- 建模工具和存储库
- 参考数据库
- 服务注册
- 其他元数据存储
元数据生命周期
- 元数据创建和采集
- 元数据在一个或多个存储库中存储
- 元数据集成
- 元数据交付
- 元数据使用
- 元数据控制和管理
元数据架构类型
- 集中式 统一、高度一致
- 分布式
- 混合式
- 双向式
活动
定义元数据战略
- 启动元数据战略计划
- 组织管理利益相关方访谈
- 评估现有的元数据资源和信息架构
- 开发未来的元数据架构
- 制定分阶段实施计划
理解元数据需求
- 更新频次
- 同步情况
- 历史信息
- 访问权限
- 存储结构
- 集成要求
- 运维要求
- 管理要求
- 质量要求
- 安全要求
定义元数据架构
- 创建元模型
- 应用元数据标准
- 管理元数据存储
创建和维护元数据
- 整合元数据
- 分发和传递元数据
查询、分析、报告元数据
工具
- 元数据存储库
方法
- 数据血缘和影响分析
- 应用于大数据采集的元数据
实施指南
- 就绪评估/风险评估
- 组织和文化变革
度量指标
- 元数据存储库完整性
- 元数据管理成熟度
- 专职人员配备
- 元数据使用情况
- 业务术语活动
- 主数据服务数据遵从性
- 元数据文档质量
- 元数据存储库可用性