- 博客(4)
- 收藏
- 关注
原创 数据仓库数据清洗之码值映射
一、映射表F_CM_CODE_MAPPING1. 源系统码值与目标码值映射关系表结构不建议将源表码值和目标码值分两个表进行关联,设计建议参考F_CM_CODE_MAPPING这个有问题,需要增加目标描述字段。 2. 源系统码值与目标码值映射关系表生成 2.1 源系统多个码值对应一个目标码值 or 源系统的码值不在码表中保存而在注释中——手工维护映
2016-07-25 22:27:27 5891
原创 ODS 和 数据仓库
下面重点介绍ODS及与数据仓库的不同,用以帮助读者思考企业系统的体系架构。本文来自于《数据仓库》的读书笔记以及具体项目中的一些思考。ODS有多种不同的种类,包括种类1、种类2、种类3、和种类4。种类之间的不同主要是对ODS的更新速度不同。第1种ODS几毫秒更新一次。第2次的更新时间是几小时。第3种大概一夜晚周期地更新。第4种的更新周期非常长(比如对消费者购买习惯进行研究,数据来源于数据仓库)。
2016-07-25 22:21:58 772
翻译 企业数据仓库中代理主键使用
阅读建议: 本文是根据TD的一篇英文文章自己翻译而来的。对于代理主键和自然键的选择没有统一的标准,也没有选谁而不能选谁。文章最后提供了可参考的选择标准。可以忽略前文所有的文字,直接看最后的表格。-----------------------------------------------------------------企业数据仓库中代理主键使用目的本文建立了关于在数据仓库
2016-07-24 19:04:53 2245
原创 HIVE关键字清单
因项目需要识别出Hive的关键字,特从Hive官网中扣下来的。如坚持使用关键字,文章最末有解决方案。Keywords, Non-reserved Keywords and Reserved KeywordsKeywordsADD,ADMIN,AFTER,ALL,ALTER,ANALYZE,AND,ARCHIVE,ARRAY,AS,ASC,
2016-07-20 23:11:18 11537 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人