- 源(系统)数据定于与说明
- 源系统地址、网络连接、访问方式;
- 计算机系统、操作系统;
- 数据库服务器名、访问方式、数据结构、有关的表、列
以上信息都是有可能要变化的,应作为元数据存入数据表,ETL程序和处理过程可以读入这些信息,以进行远程数据链接和数据访问,这大大优化将以上信息写入程序中的那种硬性编程方式;
- 源数据库链接说明;
- 逆向工程与源系统设计获取定义说明
- 元数据交换说明你。
- 暂存定义与说明
- 源至暂存区映像
- 暂存区只目标区映像
- 中间文件的传输说明
- 中间文件的说明及使用
- 中间文件的前后处理(清理与压缩)说明
- 暂存区数据库的前后处理和中间处理的说明及使用
- 目标模型定义与说明
- 星型结构;
- 事实表定义说明,包括:
- 度量
- 数字键
- 交替键
- 索引
- 定义数据(如数据类型、数值大小和默认值)
- 有效性制约
- 数据域值定义
- 分区定义说明
- 存储说明
- 维表定义与说明,包括:
- 主键
- 缓慢变化的维
- 维的等级/层次
- 维的共享
- 维的版本号
- 数据库的完整性限定
- 映像定义与说明
- 源至目标映像
- 基本数据到综合数据的映象
- 标准字典
- 转换字典
- 参照表
- 映象表
- ETL定义与说明
- 转换规则和方法
- 数据清洗说明
- 批作业说明
- 加载频率
- 累加时间片控制说明
- 退回说明与准则
- 剥离与修改数据准则
- 转换函数库
- 传输定义与说明
- 加载定义与说明
- 会期/对话管理定义与说明,包括以下几个方面
- 预定作业安排
- 批作业前后事件说明及处理方法
- 批作业日志
- 会期/对话日志
- 拒收日志
- 坏数据日志
- 综合管理系统的定义与说明
- 事实表/维度表至总计方阵映像;
- 总计至总计映像;
- 总计方阵设计;
- 聚合定义说明;
- 实体化视图/方阵定义说明,如:
- 方阵间关系
- 嵌入式实体化视图/方阵之间的关系
- 方阵组
- 刷新过程的定义与说明,包括以下几个方面:
- 刷新前后事件处理说明
- 刷新方法
- 刷新组
- 刷新执行顺序
- 刷新频率
- 刷新过程处理软件
- 刷新作业的监控检查
- 联机分析(OLAP)的定义与说明
- 查询机制;
- 虚拟方阵/视图定义;
- 访问权限管理说明;
- 用户接口定义与说明;
- 访问方式
- 结果数据提交方法;
- 结果数据传输定义与说明;
- 用户登入/登出
- 用户活动日志以及出错处理
- 联机分析用户手册
- 应用软件说明
- 软件版本号管理与说明,包括:
- 数据库应用版号
- 软件与程序版号
- 程序与数据的参照说明
- 包/过程软件函数
- 函数库
- 元件
- 程序调用层次模型定义与说明
- 2-3级结构
- 业务规则定义说明,包括:
- 业务规则表
- 业务规则表语业务政策的联系
- 软件版本号管理与说明,包括:
- 质量控制与安全说明
- 安全政策
- 审计日志
- 错误捕捉
- 错误追溯方法及说明
- 数据库访问及网络交通日志
元数据的定义和管理
来自:《数据仓库结构设计与实施——建造信息系统的金字塔》