体系结构概念:将数据仓库的所有部分结合在一起的结构就是体系结构。数据仓库的不同部分组合在一起就组成了数据仓库的体系结构。
体系结构主要目的:体系结构提供了开发和部署数据仓库的整体框架结构;它是一个全面的蓝图。体系结构定义了标准、衡量指标、通用设计和支持的技术。
数据仓库的三个主要区域和各对应的数据仓库组成部分如下:
数据获取:源数据和数据准备;
数据存储:数据存储和元数据;
信息传递:信息传递。
下图是数据仓库支持数据流的体系结构(个人感觉这个图有问题,在数据挖掘那里应该是数据准备)
这个体系结构组成包括了管理和控制组成部分。管理和控制组成部分从整体上管理和控制整个数据仓库环境的,它工作在不同的层面,并能覆盖所有的操作,组成一个散状的工作部件。这个组成部分有两个主要的功能:第一是不断监控所有正在进行的操作;第二个是出错的时候解决问题并恢复工作。
数据仓库的技术体系结构
技术体系结构就是其组成部分所提供的全部功能和服务。包括执行功能和提供服务所需要的步骤和规则,包括每一个部分提供服务所需要的数据存储器。但技术体系结构不是执行功能和提供服务所需要的工具的集合。工具只是实施体系结构的手段。这个也是为什么必须首先有体系结构然后考虑工具的原因。
三个主要区域的技术体系结构
(1)数据准备
这个区域包括了从数据源抽取数据,将抽取出的数据移入数据准备区域ÿ