1,分层
1,DWD(细节数据层或ods层),注意事项数据必须经过一定的清洗,过滤垃圾数据
2,DWB(基础数层),表设计要符合范式设计,存放宽表,维表,部分临时表,建议临时表分库存放
3,DWS(服务数据层或主题层),集市表
4,DWV (数据可视化层)报表
2,表命名规范
正式表:bas开头
维表:dim
宽表:agg
临时表:seq
分区:p
时间(统计表用):y,m,w,d
增量表:idld
业务模块:具体情况具体分析
举例:bas_module_[idld]_[yp]_表名
3,字段库
字段统一命名:业务含义相同字段命名一致
4,数据字典
建立数据字典
5,数据集成
1,数据编码不一致:例如,在一个应用中,性别编码为m/f,另一个应用中则编码为0/1,第三个应用中则编码为“男/女”。因此,当数据进入仓库时,应转换为统一的编码。
2,度量单位转换:例如,长度有的用英寸,有的用厘米,有的用毫米。在数据仓库中用哪种度量单位并不重要,重要的是必须一致。因此,想DW传送数据时,要转换为一致的度量单位。
3,字段语义的转换:例如,统一字段在几个应用中使用不同的名字。需要建立各个不同字源字段到数据仓库字段的映射。
6,未解决问题
数据同步问题:
1,上游修改数据,未修改增量数据,如何同步?
2,上游删除数据,如何同步?
oracle 触发器