DAMA-CDGA认证-第12章元数据管理

一、知识点归纳

(一)元数据管理的目标

        1.提供企业可理解的业务术语并使用它

        2.从不同来源采集和整合元数据

        3.提供访问元数据的标准方法

        4.确保元数据质量与安全

        5.推广或强制使用技术元数据标准,以实现数据交换

(二)元数据管理的度量指标

        1.元数据覆盖范围记分卡

        2.元数据存储库分发

        3.元数据使用报告

        4.元数据质量记分卡

(三)良好管理元数据有助于

        1.通过提供上下文语境和执行数据质量检查提高数据的可信度

        2.通过扩展用途增加战略信息(如主数据)的价值

        3.通过识别冗余数据和流程提高运营效率

        4.防止使用过时或不正确的数据

        5.减少数据的研究时间

        6.改善数据使用者和IT专业人员之间的沟通

        7.创建准确的影响分析,从而降低项目失败的风险

        8.通过缩短系统开发生命周期时间缩短产品上市时间

        9.通过全面记录数据背景、历史和来源降低培训成本和员工流动的影响

        10.满足监管合规

(四)元数据管理不善容易导致的问题

        1.冗余的数据和数据管理流程

        2.重复和冗余的字典、存储库和其他元数据存储

        3.不一致的数据元素定义和与数据滥用的相关风险

        4.元数据的不同版本相互矛盾且有冲突,降低了数据使用者的信心

        5.怀疑元数据和数据的可靠性

(五)成功实施元数据解决方案的指导原则

        1.组织承诺

        2.战略。元数据战略必须与业务优先保持一致

        3.企业视角

        4.潜移默化

        5.访问

        6.质量

        7.审计

        8.改进

(六)元数据的类型

        1.业务元数据

        2.技术元数据

        3.操作元数据

        在信息技术之外的领域,如在图书馆或信息科学中,元数据被描述为不同的类别

        1.描述元数据

        2.结构元数据

        3.管理元数据

(七)元数据注册标准

        第1部分:数据元素生成和标准化框架

        第2部分:数据元数据分类

        第3部分:数据元素的基本属性

        第4部分:数据定义的形成规则和指南

        第5部分:数据元素的命名和识别原则

        第6部分:数据元素的注册

(八)元数据来源

        1.应用程序中元数据存储库

        2.业务术语表

        (1)术语名称、定义、缩写或简称,以及任何同义词

        (2)负责管理与术语相关的数据的业务部门和/或应用程序

        (3)维护术语的人员姓名和更新日期

        (4)术语的分类或分类间的关联关系

        (5)需要解决的冲突定义、问题的性质、行动时间表

        (6)常见的误解

        (7)支持定义的算法

        (8)血缘

        (9)支持该术语的官方或权威数据来源

        3.商务智能工具

        4.配置管理工具

        5.数据字典

        6.数据集成工具

        7.数据库管理和系统目录

        8.数据映射管理工具

        9.数据质量工具

        10.字典和目录

        11.事件消息工具

        12.建模工具和存储库

        13.参考数据库

        14.服务注册

        15.其他元数据存储

(九)元数据架构层次

        1.元数据创建和采集

        2.元数据在一个或多个存储库中存储

        3.元数据集成

        4.元数据交付

        5.元数据使用

        6.元数据控制和管理

(十)元数据架构类型

        1.集中式元数据架构

        集中式存储库的优点:

        (1)高可用性,因为它独立于源系统

        (2)快速的元数据检索,因为存储库和查询功能在一起

        (3)解决了数据库结构问题,使其不受第三方或商业系统特有属性的影响

        (4)抽取元数据时可进行转换、自定义或使用其他源系统中的元数据进行补充,提高了元数据的质量

        集中式存储的缺点:

        (1)必须使用复杂的流程确保元数据源头的更改能够快速同步到存储库中

        (2)维护集中式存储库的成本可能很高

        (3)元数据的抽取可能需要自定义模块或中间件

        (4)验证和维护自定义代码会增加对内部IT人员和软件供应商的要求

        2.分布式元数据架构

        分布式元数据架构的优点

        (1)元数据总是尽可能保持最新且有效,因为它是从其数据源中直接检索的

        (2)查询是分布式的,可能会提高响应和处理效率

        (3)来自专有系统的元数据请求仅限于查询处理,而不需要详细了解专有数据结构,因此最大限度减少了实施和维护所需的工作量

        (4)自动化元数据查询处理的开发可能更简单,只需要很少的人工干预

        (5)减少了批处理,没有元数据复制或同步过程

        分布式元数据架构的缺点

        (1)无法支持用户自定义或手动插入的元数据项,因为没有存储库可以放置这些添加项

        (2)需要通过统一的、标准化的展示方式来呈现来自不同系统的元数据

        (3)查询功能受源系统可用性的影响

        (4)元数据的质量完全取决于源系统

        3.混合式元数据架构

        4.双向元数据架构

(十一)元数据战略步骤

        1.启动元数据战略计划

        2.组织关键利益相关方的访谈

        3.评估现有的元数据资源和信息架构

        4.开发未来的元数据架构

        5.制定分阶段的实施计划

(十二)元数据综合解决方案的功能需求

        1.更新频次

        2.同步情况

        3.历史信息

        4.访问权限

        5.存储结构

        6.集成要求

        7.运维要求

        8.管理要求

        9.质量要求

        10.安全要求

(十三)控制活动包括

        1.作业调度和监控

        2.加载统计分析

        3.备份、恢复、归档、消除

        4.配置修改

        5.性能调优

        6.查询统计分析

        7.查询和报表生成

        8.安全管理

        质量控制活动包括:

        1.质量保证,质量控制

        2.数据更新频率——与时间表匹配

        3.缺失元数据报告

        4.未更新的元数据报告

        元数据管理活动包括:

        1.加载、探测、导入和标记数据资产

        2.记录与源的映射和迁移关系

        3.记录版本

        4.用户界面管理

        5.连接数据集的元数据维护——为NOSQL提供支持

        6.数据与对内数据集建立连接——自定义连接和作业元数据

        7.外部数据源和订阅源的许可

        8.数据增强元数据,如关联GIS

        培训活动包括:

        1.教育和培训用户和数据专员

        2.生成和分析管理指标

        3.对控制活动、查询、报告进行培训

(十四)元数据管理的一般原则

         元数据管理的几个一般原则描述了管理元数据质量的方法:

        1.责任。认识到元数据通常通过现有流程产生,因此流程的执行者对元数据的质量负责

        2.标准。制定、执行和审计袁术标准,简化集成过程,并且适用

        3.改进。建立反馈机制保障用户可以将不准确或已过时的元数据通知元数据管理团队

(十五)整合元数据

        对元数据存储库扫描有两种方式:

        1.专用接口

        2.半专用接口

        半专用接口的扫描程序只产生目标存储库能够正确读取和加载的数据文件,数据文件可以被多种方式读取。扫描程序产生和使用的文件类型如下:

        1.控制文件。包含数据模型的数据源结构信息

        2.重用文件。包含管理装载流程的重用规则信息

        3.日志文件。在流程的每一阶段、每次扫描或抽取操作生成的日志

        4.临时和备份文件。在流程中使用或做追溯流程所使用的文件

(十六)元数据传递机制

        1.元数据内部网站,提供浏览、搜索、查询、报告和分析功能

        2.报告、术语表和其他文档

        3.数据仓库、数据集市和BI工具

        4.建模和软件开发工具

        5.消息传送和事务

        6.Web服务和应用程序接口(API)

        7.外部组织接口方案(如供应链解决方案)

(十七)不管理元数据的风险

        1.因不正确、不完整和不合理的假设或缺乏数据内容的知识导致错误判断

        2.暴露敏感数据,使客户或员工面临风险,影响商业信誉和导致法律纠纷

        3.如果了解数据的那些领域专家们离开了,那么它们了解的知识也随之被带走了

(十八)元数据解决方案文档可满足的需求

        1.元数据管理实施状态

        2.源和目标元数据存储

        3.元数据更新的调度计划信息

        4.留存和保持的版本

        5.内容       

        6.质量声明或警告(如缺失的值)

        7.记录系统和其他数据源状态

        8.相关的工具、架构和人员

        9.敏感信息和数据源的移除或脱敏策略

(十九)元数据管理环境的建议指标

        1.元数据存储库的完整性

        2.元数据管理的成熟度

        3.专职人员配备

        4.元数据使用情况

        5.业务术语活动

        6.主数据服务数据遵从性

        7.元数据文档质量

        8.元数据存储库可用性

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Dear__Sky

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值