基础构造是支持体系结构的基础。基础构造包括很多元素,首先,包括基本的计算机平台,这个平台包括所有需要的硬件和操作系统;其次是数据库管理系统;还有就是是数据仓库体系结构运转的人员和工作步骤也是。
基础构造元素可分为两类:操作型基础构造和物理基础构造。
(一)操作型基础构造
支持每一个体系结构组成部分的操作型基础构造包括:人员;流程;培训;管理软件。这里的人员和流程不是开发数据仓库所需要的,而是维持数据仓库运转所需要的。
(二)物理基础构造
每一个系统包括数据仓库都必须有一个完整的平台,这个平台也就是物理基础构造。基本上这个平台的组成部分包括基本的硬件部分、操作系统、数据库管理系统和网络软件等,还包括在这个平台上运行的数据获取工具、数据准备工具和信息传递工具。
1、硬件和操作系统
硬件和操作系统构成了数据仓库的计算机环境。
硬件选择
下面是已经选择的几个大体方针:
可扩展性:当数据仓库的用户数、查询的数量和复杂程度增长的时候,确保选择的硬件可以随之升级;
支持性:厂商的支持对于硬件维护非常重要。确保来自硬件厂商的支持在尽量高的水平上;
对厂商的鉴定:从其他用户那里得到厂商的鉴定是非常重要的;
厂商稳定性:检查供应商的稳定性和持久性。
操作系统选择
操作系统必须与硬件兼容。原则如下:
可扩展性:同样操作系统必须能够支持用户数和应用的快速增长;
安全性:必须向每一个客户机提供一个安全的环境;
可靠性:操作系统必须能够保护环境不遭受应用环境的损害;
有效性:这是可靠性的必然结构。计算机环境必须在非正常应用结束后能够继续工作;
优先多任务处理:服务器已经必须能够平衡时间和资源在多个任务之间的分配,而操作系统必须能够识别高优先
级的任务,或者在需要的时候中断其他任务。
使用多线程方法:必须能够在一个多处理器硬件结构中向多个处理器分配线程,从而完成同时发生的多个请求;
内存保护:内存保护特性能够保护一项任务不会干扰其他任务的内存空间。
1.1、平台选择
一个计算机平台就是硬件部分、操作系统、网络和网络软件的集合。
数据仓库的平台选择有单一平台方案和混合方案。
1.2、服务器硬件
对于数据仓库服务器硬件的选择,可扩展性和优化查询性能是关键的指标。
针对可扩展性和复杂查询处理的硬件选择由四种并行的体系结构组成。
SMP(对称多处理结构);
群集;
MPP(海量并行处理结构,Massive Parallel processer);
NUNM(非一致存储访问结构,Non-Uniform Memory Access)
2、数据库软件
数据库软件可以根据并行处理方案和数据库管理系统软件来选择。
3、工具收集