LDM代码整合与管控
1>代码整合的概念
1.1>是一种编码
代码的概念很容易让人搞混,这里的LDM代码不是指程序,而是一种编码(名词).
比如说身份证号,就是对个人ID的一个编码,不同的位数均代表不同的意义
4201062010XXXX
42:湖北省
01:武汉市
03:武昌区
2010:出生日期
1.2>代码的整合
是一个标准化的过程,整合不同源系统的源代码,目的是提供完整,清晰,统一的编码.
比如说性别
源系统A: 男->X;女->Y
源系统B: 男->M;女->F
整合到LDM: 男->1;女->0
体现数据仓库整合的特性
2> LDM中两种类型的代码
2.1>静态代码
LDM定义的硬编码,不需要做代码转换
2.2>从源系统映射过来的代码
值取自于源系统的字段,做了转换与整合的代码
3> LDM代码的内容
手工维护: 代码映射表文档与S99代码表文档
数据库: 标准代码映射表(表结构,主键),S99代码参数表
脚本: 脚本SQL直接关联使用标准代码映射表,取目标代码值
4> 代码整理与维护
在构建数据仓库时,代码整理的切入点是在字段级分析阶段.确认源系统代码字段清单,搜集代码值,代码描述等信息.
信息记录在字段级分析文档中.
整合编码的思路
先看是否有标准可遵从,比如货币代码或国家代码
区分需要整合不同源系统码值的代码,多人协作时要避免代码交叉
对于容易整合的代码,比如性别类型代码,容易整理出一套共用的代码
数据仓库中的代码整合与管控
最新推荐文章于 2024-09-26 10:22:13 发布
本文介绍了数据仓库中的代码整合与管控,包括代码整合的概念,如将不同源系统的编码标准化;LDM中静态代码和映射代码的区分;代码内容的维护,涉及手工维护、数据库存储和脚本引用;代码整理与维护的步骤和常见问题,强调了映射文件和S99代码表的重要性。
摘要由CSDN通过智能技术生成