四、数据架构
4.1引言
4.1.1整体描述
1)架构是构建一个系统的艺术和科学,以及在此过程中形成的成果——系统本身。架构是对组件要素有组织的设计,旨在优化整个结果或系统的功能、性能、可行性、成本和用户体验。
2)国际标准架构的定义:
*考点
系统的基本结构、具体体现在架构构成中的组件、组件之间的相互关系以及管理其设计和演变的原则。
3)企业架构包括多种类型,如业务架构、数据架构、应用架构和技术架构。良好的企业架构管理有助于组织了解系统的当前状态,加速向期待状态的转变,实现遵守规范,提高效率的目标。
4)数据架构的主要目标就是有效地管理数据,以及有效地管理“存储和使用数据的”系统。数据架构是数据管理的基础。
5)数据架构的基本组成部分
- 数据架构成果:包括不同层级的模型、定义、数据流,这些通常被称为数据架构的构件
- 数据架构活动:用于形成、部署和实现数据架构的目标
- 数据架构行为:包括影响企业数据架构的不同角色之间的协作、思维方式和技能
6)数据架构的构建,包括
- 当前状态的描述
- 数据需求的定义
- 数据整合的指引
- 数据管控策略中要求的数据资产管理规范
7)数据架构文件,包含
- 数据名称
- 数据属性
- 元数据定义
- 概念和逻辑实体
- 关系以及业务规则
- 物理数据模型也属于数据架构文件,但他是数据建模和设计的产物,而不是数据架构的产物!!!
4.1.2 业务驱动因素
数据架构的目标是在业务战略和技术实现之间架起一座通畅的桥梁。
数据架构的主要职责如下,也是评判数据架构任务完成情况或者价值的重要指标。
1)利用新兴技术所带来的业务优势,从战略上帮助组织快速改变产品、服务和数据。
2)将业务需求转化为数据和应用需求,以确保能够为业务流程处理提供有效的数据。
3)管理复杂数据和信息,并传递至整个企业。
4)确保业务和IT 技术保持一致。
5)为企业改革、转型和提高适应性提供支撑
4.1.3 数据架构成果和实施
1)数据架构的成果包括
- 数据存储和处理需求
- 设计满足企业当前和长期数据需求的结构和规划
2)语境关系图
3)数据架构师需要定义和维护:
- 定义组织中数据的当前状态
- 提供数据和组件的标准业务词汇
- 确保数据架构和企业战略及业务架构保持一致
- 描述组织数据战略需求
- 高阶数据整合概要设计
- 整合企业数据架构蓝图
4)总体数据架构实施包括:
- 使用数据架构构件(主蓝图)来定义数据需求、指导数据整合、管控数据资产,确保数据项目投入与企业战略保持一致。
- 与参与改进业务或IT系统开发的利益相关方合作,学习并影响他们
- 通过数据架构及通用的数据词汇,搭建企业数据语言
4.1.4 基本概念
1、企业架构类型
1)企业业务架构
目的:识别企业如何为消费者和其他利益相关方创造价值
元素:业务模型、流程、功能、服务、事件、策略、词汇
依赖项:制定其他架构的需求
角色:业务架构师和分析师、业务数据管理员
2)企业数据架构
目的:描述数据应该如何组织和管理
元素:数据模型、数据定义、数据映射规范、数据流、结构化数据应用编程接口
依赖项:管理业务架构创建和需要的数据
角色:数据架构师、建模师、数据管理员
3)企业应用架构
目的:描述企业应用的结构和功能
元素:业务系统、软件包、数据库
依赖项:依据业务需求来处理指定的数据
角色:应用架构师
4)企业技术架构
目的:描述能使系统发挥功能和传递价值的实体技术
元素:技术平台、网络、安全、整合工具
依赖项:承载并执行应用架构
角色:基础设施架构师
2、企业架构框架
即架构的架构,最著名的企业架构框架是Zachman架构
- 是什么:目录列,表示构建架构的实体
- 怎样做:流程列,表示执行的活动
- 在哪里:分布列,表示业务位置和技术位置
- 是谁:职责列,表示角色和组织
- 什么时间:时间列,表示间隔、事件、周期和时间表
- 为什么:动机列,表示目标、策略和手段
3、企业数据架构
数据架构定义了对组织非常重要元素的标准术语和设计。企业数据架构的设计中包括业务数据描述,如数据的收集、存储、 整合、移动和分布。
企业数据架构描述必须包括企业数据模型(如数据结构和数据规范)和数据流设计!
1)企业数据模型
企业数据模型是一个整体的、企业级的、独立实施的概念或逻辑数据模型,为企业提供通用的、一致的数据视图。任何项目级的数据模型必须基于企业数据模型设计。
明显特征为:
- 企业主题域的概念描述
- 各主题域的实体和关系概述
- 归属于同一主题域的详细逻辑概述
- 具体到应用或项目的逻辑和物理模型
从上到下和横纵向
- 纵向:不同层级模型之间的映射
- 横向:同一个实体和关系可能出现在同一层级的多个模型中。位于一个主题域中的逻辑模型中的实体可以和其他主题域的实体相关联;也出现在产品主题域模型中。
主题域的识别准则必须在整个企业模型中保持一致:
使用规范化规则,从系统组合中分离主题域,基于顶级流程(业务价值链)或者基于业务能力(企业架构)从数据治理结构和数据所有权(或组织)中形成主题领域。
2)数据流设计
数据流是一种记录数据血缘的数据加工过程,用于描述数据如何在业务流程和系统中流动。端到端的数据流包含了数据起源于哪里,在哪里存储和使用,在不同流程和系统内或之间如何转化。
数据流映射记录了数据与以下内容的联系