元数据及其管理
1、元数据的分类
元数据大致分为两类:
管理元数据和用户元数据
管理元数据主要为主要为负责开发、维护数据仓库的人员使用,是关于存储于数据仓库的技术细节的数据,用于开发和管理数据仓库的使用数据:
- 数据仓库的结构描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容。
- 业务系统,数据集市,数据仓库的体系结构和模式
- 汇总用的算法,度量和维定义的算法,数据粒度、主题领域、聚集、汇总、预定义的查询和报告
- 操作环境到数据仓库环境的映射,包括源数据和他们的内容数据分割、数据提取、清理、转换规则、数据刷新规则、安全(用户授权和存取的控制)
用户元数据提供了使用者和系统之间的语义层(让不懂得技术的人能够读懂数据仓库中的数据)通过用户元数据用户可以了解:
- 如何连接数据仓库
- 哪些部分可以访问
- 数据来源于哪一个源系统
2、元数据的作用
元数据主要作用:
- 元数据是进行数据集成所必需的
- 可以帮助最终用户理解数据仓库中的数据
- 元数据是保证数据质量的关键
- 可以支持需求的变化
3、元数据的管理
- 获取并存储元数据
数据仓库中的数据时间跨度比较长(5-10年),在这个期间系统可能会发生变化,对应的各种方法和算法以及本系统本身的结构和内容也会发生变化这就意味元数据管理必须提供按照合适版本来获取和存储元数据的方法能够