数据架构简介

概念定义

数据架构是一套规则、政策、标准和模型,用于管理和定义收集的数据类型,以及如何在组织及其数据库中使用、存储、管理和集成数据。
数据架构是实现数据规划的载体,是揭示业务本质、描述企业中数据关系的全景视图,是统一数据语言、理顺数据关系、消除信息孤岛、建立数据互联的基础。

组成部分

数据架构包含数据目录、数据模型、数据标准,数据分布与流向。

数据目录:

以核心元数据为主要描述方式,按照资源分类索引和目录条目格式要求,对数据库中不同类型、不同层次的数据按照一定的分类体系进行编目,用以描述数据的特征,实现对数据的索引和定位。

数据模型:

用来描述数据的结构、数据的语义、数据之间的关系,以及数据的约束。
从模型覆盖的颗粒度来看,数据模型一般分为:主题域模型、概念数据模型、逻辑数据模型、物理数据模型。
从模型的应用范畴看,数据模型分为组织级和系统应用级。组织级包括主题域模型、概念数据模型、逻辑数据模型;系统应用级包括逻辑数据模型、物理数据模型。

自上而下:逻辑数据模型–》物理数据模型–》应用数据库进行具体的建表

数据标准:

数据的命名、定义、结构和取值的规则。数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束,用以描述企业层面需要共同遵循的属性层数据含义和业务规则。
数据标准包括对象类数据标准和基础类数据标准。对象数据标准包括数据分类、指标数据、主数据和参考数据、数据元和数据标签。基础类数据标准包括业务术语标准、业务规则、密码规范和代码标准。数据标准的三个主要作用:
●规范业务定义
●统一语言,消除歧义
●为数据资产梳理提供标准的业务含义和规则

数据分布与流向

数据分布就是针对组织级数据模型中数据的定义,明确数据在组织、系统和流程等方面的分布关系,以及权威的数据源。数据流向就是数据从一个系统中传递到另一个系统中,通过系统交互及存储的路径。从数据传递和加工的角度看,数据流向体现了控制流和数据流的方向。
通过对数据分布与流向的梳理,可以定义数据相关工作的优先级,指定数据的责任人,并进一步优化数据的集成关系。数据分布与流向通常有以下3个主要作用:
●是数据在业务流程和 IT 系统中流动的全景视图。
●用于识别数据的“来龙去脉”。
●是定位数据问题的导航,包括信息链、数据流、数据源。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值