这部分对ETL系统的架构中34个关键子系统进行分类。ETL其实可以分为下面四个步骤:
- 抽取。在ETL环境中从源系统收集原始数据并且在对任何对数据的重要重构发生之前都将数据写入磁盘。子系统1到子系统3都支持抽取过程。
- 清洗和一致化。提高了从源系统接收数据的质量,并且对两个或者多个源系统中的数据进行了合并,创建并强化了一致性维度和一致性度量。子系统4到子系统8描述了支持清洗和一致化过程所需的架构。
- 提交。从物理上将数据组织和装载到呈现服务器的目标维度模型中。子系统9到子系统21提供了若干种将数据提交到服务器上的功能。
- 管理。用一致的方式来管理ETL环境中的相关系统和过程。子系统22到34描述了支持ETL系统现行管理所需的组件。