对元数据存储库的扫描有两种不同的方式:
- 专用接口。采用单步方式,扫描程序从来源系统采集元数据,直接调用特定格式的装载程序,将元数据加载到元数据存储中,在此过程中,不需要输出任何中间元数据文件,元数据的采集和装载也是一步完成的。
- 半专用接口。采用两步方式,扫描程序从来源系统中采集元数据,并输出到特定格式的数据文件中。扫描程序只产生目标存储库能够正确读取和加载的数据文件。数据文件可以被多种方式读取,所以这种接口的架构更加开放。多种类型文件:
- 控制文件,包含数据模型的数据源结构信息;
- 重用文件,包含管理装载流程的重用规则信息;
- 日志文件,在流程的每一阶段,每次扫描或抽取操作生成的日志;
- 临时和备份文件,在流程中使用或做追溯流程所使用的文件。
可以使用一个非持久的元数据暂存区进行临时和备份文件的存储,暂存区应支持回滚和恢复处理,并提供临时审计跟踪信息,这样有助于存储库管理员追踪元数据来源或质量问题,暂存区可以采用文件目录或数据库的形式。