本人刚参加了2020/06/18日的CDGA考试,虽然成绩还没出来,但是估分已有80分,故将自己一个月左右的时间整理、背诵的资料展示出来,以便大家能顺利通过。除了重点章节的语境图需要背会,只要再把我总结的知识点背会,100%必过的。每一章打印出来后只有一张A4纸,我背诵大概就是一个小时一章,每天巩固一下即可。
第十二章、元数据管理
1.元数据解决方案功能需求点:
1)更新频次
2)同步情况
3)历史信息
4)访问权限
5)存储结构
6)集成要求
7)运维要求
8)管理要求
9)质量要求
10)安全要求
2.ISO/IEC 11179元数据注册标准包括:
1)数据元素生成和标准化框架
2)数据元数据分类
3)数据元素的基本属性
4)数据定义的形成规则和指南
5)数据元素的命名和识别原则
6)数据元素的注册
3.元数据管理的目标:
1)记录和管理与数据相关的业务术语的知识体系,以确保人们理解和使用数据内容的一致性
2)收集和整合来自不同来源的元数据,以确保人们了解来自不同组织不同部门的数据之间的相似与差异
3)确保元数据的质量、一致性、及时性和安全
4)提供标准途径,使元数据使用者(人员、系统和流程)可以访问元数据
5)推广或强制使用技术元数据标准,以实现数据交换
4.结构化元数据:技术元数据、业务元数据、操作元数据(6.18考)
5.非结构化元数据:描述元数据、结构元数据、管理元数据
6.元数据管理中管理元数据的方法:责任、标准、改进
7.缺失高质量元数据可能带来的影响:(6.18考)
1)因不正确、不完整和不合理的假设或缺乏数据内容的知识导致错误判断
2)暴露敏感数据,使客户和员工面临风险,影响商业信誉和导致法律纠纷
3)如果了解数据的那些领域专家们离开了,那么他们了解的知识也随之被带走了。
8.元数据管理活动包括:
1)加载、探测、导入和标记数据资产
2)记录与源的映射和迁移关系
3)记录版本
4)用户界面管理
5)连接数据集的元数据维护——为NoSQL提供支持
6)数据对内数据采集建立连接——自定义连接和作业元数据
7)外部数据源和订阅源的许可
8)数据增强元数据,如关联GIS
9.集中式元数据架构的缺点:
1)必须使用复杂的流程确保元数据源头中的更改能够快速同步到存储库中。
2)维护集中式存储库的成本可能很高
3)元数据的抽取可能需要自定义模块或中间件
4)验证和维护自定义代码会增加对内部IT人员和软件供应商的要求
10.分布式元数据架构的缺点:
1)无法支持用户定义或手动插入的元数据项,因为没有存储库可以放置这些添加项。
2)需要通过统一的、标准化的展示方式呈现来自不同系统的元数据
3)查询功能受源系统可用性的影响
4)元数据质量完全取决于源系统