DAMA中国CDGA 考试复习重点

第1 章 数据管理

从数据中获取的价值不可能凭空产生或依赖于偶然。需要有目标、规划、协作和保障。也需要管理和领导力。

数据管理(Data Management)是为了交付、控制、保护并提升数据和信息资产的价值。

  • 数据管理最直接的目标。数据质量
  • 数据管理最终目标:数据价值

数据管理的主要驱动力也是使组织能够从其数据资产中获取价值。

二者都是数据:

  • 以数字形式存储的
  • 纸面上的数据

大多数人认为数据代表事实。数据是这个世界中与某个事实结合在一起的一种真实表达。 但“事实” 并不总是简单或直接的。 数据是一种表示方法。它代表的是除自身以外的事物。 数据既是对其所代表对象的解释。也是必须解释的对象。

关于数据和信息的描述早已汗牛充栋。 数据被称为“信息的原材料”。而信息则被称为“在上下文语境中的数据”。

信息是经过加工了的。

着重点不在于他们的差别,而在于他们的相同点:在本书中。这些术语可以互换使用。

考题:

A. 数据和信息不一样

B. 这些术语可以互换使用

数据作为一种资产:

损益表: 数据还无法上财务报表。数据作为资产离财务报表还有多远?

满足了财务会计准则的20条,但不符合21和22条

数据作为资产要上财务报表,是需要修改现有的财务准则的。

数据价值评估模型,目前全国只有两家是国家层面认可的:

  1. 光大银行
  2. 南方电网

数据管理原则总有12项,这个都需要知道:

  1. 数据是有独特属性的资产
  2. 数据的价值可以用经济术语来表示
  3. 管理数据意味着对数据的质量管理
  4. 管理数据需要元数据
  5. 数据管理需要规划
  6. 数据管理须驱动信息技术决策
  7. 数据管理是跨职能的工作
  8. 数据管理需要企业级视角
  9. 数据管理需要多角度思考
  10. 数据管理需要全生命周期的管理
  11. 数据管理需要纳入与数据相关的风险
  12. 有效的数据管理需要领导层承担责任

什么是元数据: 这是技术术语

从业务层面来讲: 元数据就是:数据资源目录

数据与其他资产的区别

实物资产是看得见、摸得着、可以移动的。在同一时刻只能被放置在一个地方。 金融资产必须在资产负债表上记账。 然而数据不同。它不是有形的。 尽管数据的价值经常随着时间的推移而变化。但它是持久的、不会磨损的。 数据很容易被复制和传送。但它一旦被丢失或销毁。就不容易重新产生了。 因为它在使用时不会被消耗。所以它甚至可以在不损耗的情况下被偷走。 数据是动态的。可以被用于多种目的。 同样。数据甚至可以在同时被许多人使用。而对实物资产或金融资产来说。这是不可能的。 数据被多次使用产生了更多的数据。大多数组织不得不管理不断提升的数据量和越来越复杂的数据关系。

数据价值: DAMA用的基本还是成本法

1)获取数据的成本

2)存储数据的成本

建立企业的视角是为了 ==》打通数据孤岛

如何实现 – 打通数据孤岛:

  • 国外: 主数据
  • 国内: 数据中台

数据ROT (冗余的、过时的、不重要的) 降至最低 ==》 就表示提高数据质量。

不同种类的数据其它可以忽略不计,但需要知道这二者的差别: OLTP vs. OLAP

首席数据官(CDO) : chief data officer

数据管理战略规划的可交付成果包括:

1) 数据管理章程。 包括总体愿景、业务案例、目标、指导原则、成功衡量标准、关键成功因

素、可识别的风险、运营模式等。

2) 数据管理范围声明。 包括规划目的和目标(通常为3 年)。以及负责实现这些目标的角色、

组织和领导。

3) 数据管理实施路线图。 确定特定计划、项目、任务分配和交付里程碑。

数据治理框架:

1) 前两个模型。即战略一致性模型和阿姆斯特丹(Amsterdam) 信息模型。展示了组织管理数据的高阶关系。

2) DAMA-DMBOK 框架(DAMA 车轮图、六边形图和语境关系图)。 描述了由DAMA 定义的数据管理知识领域。并解释了它们在DMBOK 中的视觉表现。

3) 最后两个模型是以DAMA 为基础重新排列组件。以便于更好地理解和描述它们之间的系。

战略一致性模型和阿姆斯特丹信息模型,都是强调:

  • 业务和IT的一致性
  • 数据和IT的一致性?
  • 软件系统和硬件系统?

DAMA框架包括三个内容:

1) DAMA 车轮图、2) 六边形图、和3)语境关系图

1) DAMA 车轮图: 总论,数据管理到底包括哪些内容,共11项。

2) 六边形图:需要知道六边形指什么

3)语境关系图:需要知道语境关系指什么

阿姆斯特丹信息模型与战略一致性模型一样。从战略角度看待业务和IT的一致性。

语境关系图中的“活动”是指:

A。计划(P)、控制(C)、开发(D) 和运营(O)

B。计划(P)、开发(D) 控制(C)、和运营(O)

考题中,有可能4个选项全对的。在这种情况下,就需要选择最佳答案A。

第2 章 数据处理伦理

简单来说。伦理是建立在是非观念上的行为准则。 伦理准则通常侧重于公平、尊重、责任、诚

信、质量、可靠性、透明度和信任等方面。

对于数据管理专业人员及其工作的组织来说。数据伦理是一项社会责任问题。

数据处理伦理问题较为复杂。不过主要集中在几个核心概念上:

1) 对人的影响。 由于数据代表个人的特征。可被用于各类决策。从而影响人们的生活。因此

必须保证其质量和可靠性。

2) 滥用的可能。 滥用数据会对人和组织造成负面影响。所以需要有伦理准则来防止数据被滥用。

3) 数据的经济价值。 数据存在经济价值。 需要规定数据所有权。即谁可以去使用数据及如何

使用数据。

正如爱德华.戴明关于质量的定义。伦理意味着“在没有人注意的情况下正确做事”。

我们中文讲的就是:慎独

法律往往是延后的,也不可能面面俱到。所以需要伦理道德的自我约束。

数据伦理准则是指:

  1. 尊重他人
  2. 行善原则
  3. 公正
  4. 尊重法律和公众利益

数据隐私法: 背后都是伦理准则。伦理准则提升成为法律。

GDPR准则需要知道:

GDPR 准则

描述

公平、 合法、透明

数据主题中的个人数据应以合法、公平,透明的方式进行处理

目的限制

必须按照指定、明确、合法的目标去采集个人数据,并且不得将数据用于收采集目标之外的方面。

数据最小化

采集的个人数据必须足够相关,并且仅限于与处理目的相关的必要信息。

准确性

个人数据必须准确,有必要保持最新的数据。必须采取一切合理步骤,确保在考虑处理个人数据目的时,能及时删除或更正不准确的个人数据。

存储限制

数据必须以可以识别的数据主体(个人)的形式保存,保存时间不得超过处理个人数据所需的时间。

诚信和保密

必须确保个人数据得到安全妥善的处理,包括使用适当技术和组织方法防止数据被擅自或非法处理、防止意外丢失、破坏或摧毁等。

问责制度

控制数据的人员应负责并能够证明符合上述这些原则。

数据伦理问题的部分场景,比如:

  1. 时机选择
  2. 可视化误导
  3. 定义不清晰或无效的比较
  4. 偏见

偏见有几种类型:

1) 预设结论的数据采集。 分析师迫于压力采集数据并产生结果。来支持一个预先定义的结论。

而不是为了得出一个客观的结论。

2) 预感和搜索。 分析师有一种预感。且想要满足这种预感。故只使用能证实这种直觉的数据。

并且不想考虑从数据中能得出的其他可能性(如果某些数据不能证实该方法。它可能会被丢弃)。

3) 片面抽样方法。 抽样往往是数据采集的一个常用方法。 但是。选择样本集的方法可受到偏

见的影响。 对于人类来说。没有某种偏见。几乎是不可能的。 为了限制偏见。可使用统计工具选择

样本并建立适当大小的样本。 意识到用于训练目的样本数据可能存在偏见尤其重要。

5) 背景和文化。 偏见通常是基于文化或背景。因此。要中立地看待事物。就必须走出这种文

化或背景。

第3 章 数据治理

数据管理 > 数据治理

数据治理是数据管理的1/11

数据治理: 人、组织和规章制度;并不直接管理数据

就好像会计审计人员和财务会计人员之间的关系。

数据治理的内容:

  • 战略Strategy定义、交流和驱动数据战略和数据治理战略的执行
  • 策略Policy设置与数据、元数据管理、访问、使用、安全和质量有关的策略
  • 标准和质量Standards and quality设置和强化数据质量、数据架构标准
  • 监督(Oversight在质量、政策和数据管理的关键领域提供观察、审计和纠正等实际操作措施(通常称为管理职责stewardship
  • 合规Compliance确保组织可以达到数据相关的监管合规性要求
  • 问题管理Issue management识别、定义、升级和处理问题,针对如下领域:数据安全、数据访问、数据质量、合规、数据所有权、政策、标准、术语或者数据治理程序等
  • 数据管理项目Data management projects增强提升数据管理实践的努力
  • 数据资产估价(Data asset valuation设置标准和流程,以一致的方式定义数据资产的业务价值

数据治理最常见的驱动因素是法规遵从性。特别是重点监控行业。

(1) 减少风险

(2) 改进流程

数据治理不是一次性的行为。

数据治理要与IT治理区分开。

为达到整体目标,数据治理程序必须要:

  • 可持续发展Sustainable治理程序必须富有吸引力。它不是以一个项目作为终点,而是一个持续的过程,需要作为整个组织的责任。数据治理必须改变数据的应用和管理方式,但也不代表着组织要做巨大的更新和颠覆。数据治理是超越一次性数据治理组件实施的可持续发展的路径管理变革。可持续的数据治理依靠于业务领导、发起者和所有者的支持。
  • 嵌入化(Embedded数据治理不是一个附加管理流程。数据治理活动需要融合到软件开发方法、数据分析的应用,主数据管理和风险管理中。
  • 可度量Measured数据治理做得好有积极的财务影响,但要证明这一影响,就需要了解起点并计划可度量的改进方案。

正如财务审计人员实际上并不执行财务管理一样。数据治理确保数据被恰当地管理而不是直接

管理数据(参见第15 章)。 数据治理相当于将监督和执行的职责分离。 

数据治理可以有三种模式:

在集中式管理模式中。数据治理组织监督所有业务领域中的活动。 在分布式管理模式中。每个

业务单元中采用相同的数据治理运营模型和标准。 在联邦式管理模式中。数据治理组织与多个业务单元协同。以维护一致的定义和标准。

数据管理职责 Data Stewardship,不是数据的owner,

数据管理职责是一种业务职责,主要负责对数据资产的有效控制和使用。管理职责可以通过职位名称和职责描述正式确定,也可以采用非正式形式,由帮助组织获取数据价值的人所驱动。通常情况下,像保管人、受托人这样的称呼,就是类似的管理职能的同义词。

管理职责的焦点因组织不同而不同,取决于组织战略、文化、试图解决的问题、数据管理成熟度水平以及管理项目的形式等因素。然而在大多数情况下,数据管理活动将集中于以下部分(未必全部):

  • 创建和管理核心元数据Creating and managing core Metadata业务术语、有效数据值及其他关键元数据的定义和管理。通常管理专员负责整理的业务术语表,成为与数据相关的业务术语记录系统。
  • 记录规则和标准Documenting rules and standards业务规则、数据标准及数据质量规则的定义和记录。通常基于创建和使用数据的业务流程规范,来满足对高质量数据的期望。为确保在组织内部达成共识,由管理专员帮助制定规则并确保其得到连贯的应用。
  • 管理数据质量问题Managing data quality issues
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值