数据仓库整合各系统码表和参数表
在建立数据仓库时,需要调研涉及到各个源系统,根据各源系统的码值,可分为如下几种类型,针对不同类型的代码做整合。
各码表及参数表类型
通用类代码
通用代码,包含有行政区划、币种、行业分类、国别与地区等。
GB/T 2260-2007 中华人民共和国行政区划代码
GB/T 2659-2000 世界各国和地区名称代码
GB/T 4754-2017 国民经济行业分类
GB/T 12406-2008 表示货币和资金的代码
手工录入代码
各个系统中代码表中不存在的字典码值,也不是标准类的代码,比如一些标志、是否、或者记录在表注释中的代码值,比如comment 0 未确定、1 确定;0 未审核 1 审核通过 2 审核不通过等,需要手工维护到数据仓库码表中(总之就是系统不存在的、或难以取得的、手工维护更加方便的,且还需要关联使用的)。
直接加载使用
各个系统码值直接加载过来并使用,代码值无需转换。通常是某个系统使用而其他系统不会使用。在进入仓库时,需要按照仓库的规则修改下表的名称。
转换加载使用
各个系统码值直接加载无法使用,需要做转换合并处理,比如证件类型,客户类型,机构类型等。
比如A系统有证件类型1,2,3,4 分别代码 身份证,户口本,临时身份证,其他。
而B系统又证件类型为:01,02,03,04,05