比尔*门恩(Bill Inmon)给出了数据仓库这样一个定义,数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。今天单就数据仓库的集成整合特性进行思考,我想数据仓库的集成性大致主要体现在如下几个方面。
1、将企业相关IT系统经过面向主题的处理,本身就是一种集成
1.1、不同系统、不同业务逻辑的相关数据在各主题的统一
1.2、不同系统、相似业务逻辑的相关数据在同一主题内或主题之间的数据整合
2、统一的命名规范
2.1、表名、字段名、存储过程名以及用户名的统一规划命名
如:表名或字段名统一使用英文大写字母和固定的字段英文简称,如“LOAN_CONTRACT_NO”表示贷款合同编号;表名相同主题下具有相同的前缀;每一字段和表都要求有必要的注释等。
2.2、代码字段、标志字段统一添加后缀处理
如:为与其他键及属性字段区分,代码字段、标志字段统一添加“_CD”、“_FLAG”后缀。
2.3、相同字段在不同仓库表里统一用同一个列名及相应的注释
3、相同及相似字段的Domain处理
3.1、对于相同字段在不同数据仓库表里,其字段类型用Domain统一处理
3.2、对于有需要的可以处理为同一字段类型的不同字段,也使用Domain统一处理
4、公共代码及代码值的统一
</
1、将企业相关IT系统经过面向主题的处理,本身就是一种集成
1.1、不同系统、不同业务逻辑的相关数据在各主题的统一
1.2、不同系统、相似业务逻辑的相关数据在同一主题内或主题之间的数据整合
2、统一的命名规范
2.1、表名、字段名、存储过程名以及用户名的统一规划命名
如:表名或字段名统一使用英文大写字母和固定的字段英文简称,如“LOAN_CONTRACT_NO”表示贷款合同编号;表名相同主题下具有相同的前缀;每一字段和表都要求有必要的注释等。
2.2、代码字段、标志字段统一添加后缀处理
如:为与其他键及属性字段区分,代码字段、标志字段统一添加“_CD”、“_FLAG”后缀。
2.3、相同字段在不同仓库表里统一用同一个列名及相应的注释
3、相同及相似字段的Domain处理
3.1、对于相同字段在不同数据仓库表里,其字段类型用Domain统一处理
3.2、对于有需要的可以处理为同一字段类型的不同字段,也使用Domain统一处理
4、公共代码及代码值的统一
</