与其他形式的数据一样,元数据也有生命周期,从概念上讲,所有的元数据管理解决方案都包含与元数据生命周期相对应的架构层次。
- 元数据创建和采集;
- 元数据在一个或多个存储库中存储;
- 元数据集成;
- 元数据交付;
- 元数据使用;
- 元数据控制和管理。
可以采用不同的架构方式获取、存储、集成和维护元数据、供数据消费者访问元数据。
集中式元数据架构
集中式元数据架构是由单一的元数据存储库组成,包含来自各种不同源的元数据副本。IT资源有限的组织或者哪些追求尽可能实现自动化的组织,可能会选择避免使用此架构选项。在公共元数据存储库中寻求高度一致性的组织,可以从集中式元数据架构中受益;
集中式存储库的优点是:
- 高可用性,因为它独立于源系统;
- 快速的元数据检索,因为存储库和查询功能在一起;
- 解决了数据库结构问题,使其不受第三方或商业系统特有属性的影响;
- 抽取元数据时可进行转换,自定义或使用其他源系统中的元数据进行补充,提高了元数据的质量;
集中式存储库的缺点:
- 必要使用复杂的流程确保元数据源头中的更改能够快速同步到存储库中;
- 维护集中式存储库的成本可能很高;
- 元数据的抽取可能需要自定义模块或中间件;
- 验证和维护自定义代码会增加对内部IT人员和软件供应商的要求;
分布式元数据架构
一个完全分布式的架构维护了一个单一的接入点。