DAMA中国CDGA重难点考试指南,协会公开版

该文档围绕 DAMA 中国 CDGA 考试重点展开,全面涵盖数据管理领域多方面知识,为考生提供关键指引,有助于理解数据管理核心概念、方法及应用场景,为数据管理专业学习和实践奠定基础。

第 1 章 数据管理

数据管理旨在提升数据和信息资产价值,直接目标是数据质量,最终目标为实现数据价值,主要驱动力是从数据资产中获取价值。数据既包括数字存储形式,也涵盖纸质数据。在数据与信息的关系上,二者术语在本书中可互换使用。数据作为资产目前无法登上财务报表,价值评估常用成本法、市场法和盈利法,DAMA 主要采用成本法。数据管理遵循 12 项原则,如数据是独特资产、管理需考虑元数据等。建立企业视角有助于打通数据孤岛,国外通过主数据,国内借助数据中台和 OneID 实现。此外,降低数据 ROT 可提高数据质量,需区分 OLTP 和 OLAP,数据管理战略规划有特定可交付成果,还介绍了数据治理框架和 DAMA 框架等内容。

第 2 章 数据处理伦理

伦理是基于是非观念的行为准则,数据处理伦理对数据管理专业人员和组织而言是社会责任问题。其核心概念包括对人的影响、滥用可能以及数据经济价值。数据伦理准则涵盖尊重他人、行善原则、公正、尊重法律和公众利益,数据隐私法是伦理准则的法律体现,如 GDPR 准则,规定了数据处理的公平合法透明、目的限制等要求。数据伦理问题体现在时机选择、可视化误导、偏见等场景,偏见类型包括预设结论的数据采集、片面抽样方法等,为减少偏见可利用统计工具。

第 3 章 数据治理

数据治理是数据管理的一部分,涵盖组织架构、规章制度、流程和技术等内容。常见驱动因素是法规遵从性,可减少风险、改进流程,且不是一次性行为,要与 IT 治理区分开。数据治理有集中式、分布式和联邦式三种模式。组织架构涉及首席数据官、委员会、数据管理专员和数据 owner 等角色及问责机制。数据治理战略交付物包含章程、运营框架和职责、实施路线图等,构建运营模型时需考虑数据价值、业务模式、文化因素和监管影响等方面,制定业务术语表存在争议,还介绍了数据治理指标示例。

第 4 章 数据架构

数据架构是企业架构的一部分,目标是连接业务战略与技术实现,包括数据模型(概念、逻辑、物理模型)和数据分布图。建立企业数据架构需进行战略规划、沟通文化建设、组织协调等工作。企业数据架构项目活动涉及定义范围、理解业务需求、设计、实施、运维和运营等环节,项目中的架构角色依软件开发过程和方法嵌入项目。实施企业数据架构要建立团队、生成构件初始版本等,衡量指标包括架构接受度、实施趋势和业务价值,同时提到利旧原则,即现有系统满足 75% 新需求时应利旧。

第 5 章 数据建模和设计

数据建模决定表结构设计,影响存储成本和性能,对数据管理至关重要,如提供通用词汇表、辅助信息记录等。常见数据模型模式有关系模式、多维模式等六种,分概念、逻辑和物理三层模型,包含实体、关系、属性和域等组件。正向工程从需求构建新应用程序,逆向工程记录现有数据库,在元数据管理中作用重大。数据标准可参考多种标准或自建,还介绍了键和域的概念。维度建模用于 OLAP,有事实表和维度表,SCD 用于管理渐变类维度变化。非关系型数据库(NoSQL)有文档、列等类型,物理数据模型受技术约束,逆规范化可提高 OLAP 性能。

第 6 章 数据存储和操作

数据库操作和技术支持中,数据库管理员(DBA)作用关键,其分为生产 DBA、应用程序 DBA 等。数据库处理分 ACID 和 BASE 两种类型,CAP 定理指出分布式系统在一致性、可用性和分区容错性上只能三选二。不同数据库性能有差异,数据库备份和 RAID 技术用于保障数据安全和存储性能,OLTP 和 OLAP 对存储和处理要求不同。变动数据捕获(CDC)技术用于捕获数据变化,市场上主流 RDBMS 有 Oracle、SQL Server 等。此外,还涉及去 IOE、信创安可等概念,以及数据库性能管理和调优方法。

第 7 章 数据安全

数据安全与网络安全不同,业务驱动因素包括降低风险等。数据安全活动目标是支持适当访问、防止不当访问,确保合规和满足利益相关者需求。数据安全要求和过程分为 4A(访问、审核、身份验证、授权)及 E(权利),数据加密技术包括哈希、对称加密等,数据脱敏有静态和动态两种类型。渗透测试用于识别系统漏洞,数据安全涉及设施、设备等多方面安全,有不同机密分类级别和多种敏感数据类型,还介绍了权限管理(CRUD 权限)和职责管理(RACI 矩阵),以及数据安全度量指标。

第 8 章 数据集成和互操作

数据集成的抽取、转换、加载有 ETL 和 ELT 两种方法,ETL 用于结构化数据和数仓,ELT 适用于结构化与非结构化数据和数据湖。转换包括格式、结构、语义变化等多种形式,映射是转换的同义词。血缘关系和时延影响数据加载方法,数据高铁体现数据传输时效性。实现数据集成的软件众多,分批量和实时处理软件。交互模型有点到点、中心辐射型和发布与订阅三种,编排用于描述流程组织执行,还介绍了数据联邦和数据虚拟化技术,以及衡量数据集成解决方案的指标。

第 9 章 文件和内容管理

本章重点在于内容管理,因自然语言处理(NLP)技术不成熟而具有挑战性。文件和内容管理的业务驱动因素包括法规遵从性、诉讼响应能力和业务连续性要求。档案包括纸质文件和电子化存储信息,实施最佳实践目标是高效采集和使用非结构化数据、实现数据整合、遵守法律义务。元数据对管理非结构化数据至关重要,基于数据格式、可搜索性等方面定义。只有部分文件能成为档案,精心管理的档案具有内容准确完整、背景信息完善等特点,还涉及电子取证和非结构化数据的多种格式。

第 10 章 参考数据和主数据

参考数据和主数据管理旨在提高数据质量,通过共享数据和标准化过程实现。理论上识别主数据及其作用存在难点,实践中落地有阻力。主数据源于生产系统,经 ETL 处理应用到生产系统;参考数据非生产系统产生,拿来即用。主数据管理规划目标是确保数据完整一致、促进共享、降低成本,在一个域内规划主数据管理有识别数据源、制定规则等步骤,主数据管理可在不同层面进行,采用最大公约数原则解决层级问题。

第 11 章 数据仓库和商务智能

数据仓库建设受运营支持、合规需求和商务智能活动驱动,应遵循聚焦业务目标等原则。其由集成数据库和相关软件程序组成,包含数据抽取、清洗等操作过程。Bill Inmon 和 Ralph Kimball 对数据仓库定义和建设方法不同,但核心理念相似。数仓核心内容包括数据源、ETL 和中央仓库,多维模型由事实表和维度表组成。数据加载方式多样,开发数据仓库和数据集市项目有数据、技术和商务智能工具三条构建轨迹,还介绍了 OLAP 的实现方法和度量指标。

第 12 章 元数据管理

元数据管理遵循 “应归尽归,应收尽收” 原则,技术上的元数据等同于业务上的数据资源目录,但不同于数据资产目录。元数据常见定义是 “关于数据的数据”,分为业务、技术和操作元数据,来源广泛。元数据综合解决方案涵盖更新频次、同步情况等功能需求点。创建元数据存储库的数据模型(元模型)用于查询、报告和分析元数据,包括血缘关系和影响分析。还介绍了相关软件和元数据度量指标,如元数据存储库完整性、管理成熟度等。

第 13 章 数据质量

数据质量管理是持续性工作,业务驱动因素包括提高数据价值、降低风险等。应遵循重要性、全生命周期管理等原则,数据质量满足消费者需求即为高质量。2013 年 DAMA UK 发布的数据质量 6 个核心维度包括完备性、唯一性等,维度名称可自定义。数据质量改进常用戴明环(计划 - 执行 - 检查 - 处理)方法,评估需依据业务和技术规则,常见问题原因包括缺乏领导力等,数据剖析可辅助检查数据质量,执行数据修正有自动、人工检查和人工修正三种方法,还介绍了数据质量指标和根本原因分析方法。

第 14 章 大数据和数据科学

数据科学融合数据挖掘、机器学习等技术,依赖丰富数据源、信息组织分析和交付等。数仓主要进行描述性分析,数据科学侧重于预测性和规范性分析。早期用 3V(数据量大、更新快、类型多样)定义大数据特征,湖仓一体是发展方向。数据湖为数据科学家提供环境,但存在数据安全、质量和元数据管理等风险。机器学习算法分监督学习、无监督学习和强化学习三种类型,规范分析比预测分析更进一步,还介绍了选择算法的指标和相关开源项目。

第 15 章 数据管理成熟度评估

除 DAMA 外,还有其他数据管理成熟度评估框架,我国常用 DCMM。评估框架通常分多个级别,如 0 级无能力至 5 级优化级。组织进行评估的原因包括监管要求、数据治理需求、过程改进等。DCMM 包含 8 个大类、28 个子类和 455 项。评估前需告知利益相关方目的、方式、参与部分和时间表,成熟度评估一般有 5 个步骤,有时需重新评估以跟踪改进效果或应对组织变化。

第 16 章 数据管理组织与角色期望

2014 年 Dataversity 研究概述了 CDO 的常见任务,包括建立数据战略、制定治理标准等。数据管理组织中有不同角色,数据管理专员属业务角色,还有混合角色需兼具业务和技术知识。数据质量分析师负责数据适用性和质量问题分析,元数据专家管理元数据,商务智能架构师设计用户环境,商务智能分析师 / 管理员支持业务人员使用数据,商务智能项目经理协调整合需求和计划。

第 17 章 数据管理和组织变革管理

组织在面对变革时可能出现自满场景,如对监管、业务和技术变革反应不当。在信息管理方面,监管变化、信息安全威胁等因素促使紧迫感产生。一个好的愿景具备明确性、动力性和一致性等特征,科特确定了有效传播愿景的七大关键要素。变革平衡公式(Gleicher 公式)表明,当对现状的不满、对更好替代方案的愿景和实现目标的第一步行动的合力大于组织阻力时,变革会发生。总体和单独的沟通计划应目标明确、为受众定制并通过合适媒介传达。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小黄人2025

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值