如何看待数据模型在数据管理中的位置?




国际数据管理协会DAMA在DMBOK2中定义了11个数据管理职能领域,数据建模与设计是其中的一个关键领域。数据模型作为数据建模与设计的核心产出物,势必与其他各个领域都有着千丝万缕的联系。我尝试着将这些关系总结整理成这篇文章,与大家一同分享。





大数据产业创新服务媒体

——聚焦数据 · 改变商业


如下图,在DMBOK2中,数据管理包含了11个职能领域,这11个领域分别是数据治理、数据架构、数据建模与设计、数据存储与操作、数据安全、数据集成与互操作、文档与内容管理、参考数据与主数据管理、数据仓库与BI、元数据、数据质量。

图1DAMA定义的11个数据管理职能领域

(DMBOK2, DAMA International)

各个领域的定义和作用书中已经介绍得很清楚,所以我在这里就不赘述了,下图是我从数据模型出发,总结出的数据模型与各领域产出物之间的关系图:

图2数据建模与数据管理各领域的输入输出关系

各领域之间的这些输入输出关系让数据管理各个领域之间形成了一张关系复杂的网。其中数据模型处于一个关键位置。我将数据模型与各领域的关系总结成了以下9点

1

数据模型是承载着数据需求的元数据集合

从一定程度上讲,我个人认为数据模型是真正立足于企业数据需求创建出来的元数据集合。其中包括实体名、属性名等丰富的技术元数据,还包括业务规则等业务元数据,主外键等关系是元数据血缘分析的主要来源之一。同时,数据模型也为元数据管理提供了元数据标准和元数据质量评分的指标参考。

2

数据模型是数据校验的对象之一,是形成数据质量规则的基础

数据模型为数据质量管理提供关键元数据与业务规则输入,以便人们可以针对性地根据企业现状制定数据质量检核标准与数据质量检核规则。同时数据模型本身也需要符合数据质量管理标准,需要通过数据质量管理的检核。 

3

数据模型是数据集成与互操作的起点

为了在数据集成时创建一个单一、一致的数据版本,在数据集成时充分分析现有数据模型就显得尤为重要。保证数据模型中关键元素的一致是数据集成时需要首要考虑的问题。

4

数据模型是数据存储与操作的结构保障

数据模型精确标准的定义为数据提供了一个规范的结构,这种比较精确化的结构和约束成为数据存储和操作的一层基本结构保障,减少了数据存储和操作时发生数据异常的可能性。

5

数据模型是数据安全管控的对象之一

数据模型是数据安全管控的对象之一,数据模型中往往需要根据具体的数据安全需求标注出敏感字段/表,企业也需要参考着数据模型来制定具体的数据安全技术实现需求与业务规则,判断出那些字段可以被哪些人查看,哪些字段需要脱敏等。

6

数据模型通过文档和内容管理实现可复用

在初始数据建模阶段,有效的文档和内容管理可以为数据建模提供以往数据建模过程的详细参考。在建模完成时,数据建模过程中的各种模型设计文档,可以通过文档和内容管理模块实现合理存储,形成企业数据模型记忆库,供未来其他部分数据建模参考,或供数据模型维护阶段参考,实现数据模型的复用。

7

数据模型是数据仓库和BI的核心

数据模型能为数据仓库建设提供全面的业务梳理和整体的数据视角,通过数据模型,业务人员、开发人员能够很容易在数据仓库需求、范围以及长远建设规划上达成共识,真正形成业务到数据仓库的映射。通过专门为BI数据分析而设计的维度模型,更好地分析立足于数据分析的数据需求。可以说没有数据模型,数据仓库与BI就无从谈起。

8

数据模型为参考数据与主数据管理提供

一致性指导

参考数据与主数据管理是通过管理共享数据,去满足组织目标、减少数据冗余风险、保证更高的数据质量、减少数据集成成本的过程。(DMBOK2,DAMA International)。

在全面的MDM环境中,逻辑数据模型将在多个平台中进行物理实例化,逻辑数据模型为主数据管理提供了清晰、一致的数据定义,它指导MDM解决方案的实施,并提供了数据集成服务的基础。

9

数据模型为数据科学与AI提供数据保障

数据科学与AI离不开数据,而数据模型恰恰就是为数据科学与AI后续算法与分析过程提供数据的基本保障。数据模型的建立能够让各个数据管理领域有着力点,从而能够为数据科学家们的业务分析工作提供更准确的数据,让AI算法得出更准确的结果。

总结

可以说,数据模型在数据管理中处于向上承接业务,向下引导数据的关键位置。它是承载着数据需求的元数据、是数据质量校验的对象、是形成数据质量规则的基础、是数据集成与互操作的起点、是数据存储和操作的结构保障、是数据安全管控的对象、是数据仓库和BI的核心、是参考数据与主数据的一致性指导。做好数据模型的管理,企业数据管理将会事半功倍。

参考

[1]DAMA International.DAMA-DMBOK: DataManagement Body of Knowledge (2nd Edition)[M].Technics Publications:BASKINGRIDGE, NEW JERSEY,2017:123.

—— / END / ——

职位热招中

①【北京】TalkingData

资深银行行业BD-华北/华东JD、资深非银行业BD-华东/华南JD、数据分析师JD丨点击“这里”了解详情

②【北京】金山云云智能解决方案中心大数据团队

大数据架构师、Java架构师丨点击“这里”了解详情

③【上海】数数科技

大数据运维支持工程师、大数据研发工程师、SDK研发工程师、数据分析师、销售经理(上海、北京、深圳)、高级数据产品经理、测试开发工程师丨点击“这里”了解详情

④【杭州+上海+北京+成都】蚂蚁金服大数据部

均为实习生招募—研发类:数据研发工程师、JAVA工程师、前端工程师丨算法类:机器学习算法工程师丨产品类:数据产品经理丨点击“这里”了解详情

⑤【杭州】阿里数据中台品牌团队

均为市场及品牌岗位:数据品牌管理、数据中台整合营销、数据中台内容运营、数据中台渠道策略运营丨点击“这里”了解详情

⑥【杭州】数字浙江

社招:JAVA开发工程师丨校招:数据开发工程师、JAVA开发工程师丨点击“这里”了解详情

⑦【郑州】中原银行三波共33个职位等你来:

了解第一波招聘点“这里

了解第二波招聘点“这里

了解第三波招聘点“这里

提示:如贵公司近期有职位发布需求,可发送内容至数据猿寻求友情扩散fabu@datayuan.cn

2019数据猿年度榜单:

2019大数据产业趋势人物榜TOP 10

●2019大数据产业创新服务企业榜TOP 15

●2019大数据产业创新服务产品榜TOP 40

数据猿公益策划活动

 

#榜样的力量#

寻找新冠战“疫”,中国数据智能产业先锋力量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值