- 博客(5)
- 资源 (4)
- 收藏
- 关注
原创 DataStage “Sort、Remove Duplicates”控件使用总结
1. Sort、Remove Duplicates使用时,Hash分区
2014-08-19 00:53:45 1323
转载 数据仓库数据质量管理【转】
一个完善的数据仓库必须含有一个完整的数据质量管理系统与元数据管理系统,但是目前国内的数据仓库对数据质量管理这块都不是那么重视,我个人觉得这是一个很大的误区,一个数据仓库如果连数据质量都无法保证,还如何基于做出有效的分析来给决策者做决策的依据?从个人理解的角度看,数据质量管理系统应该包含数据质量检测、脏数据的处理与修正这两块。对于数据质量检测这块,又分为物理数据监控与逻辑数据监控。我个人理解的物
2013-06-18 13:03:44 1511
转载 关系数据库的几种设计范式介绍
1、第一范式(1NF)在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性,就可能需要定义一个新的实体,新的实体由重复的属性构成,新实体与原实体之间为一对多关系。在第一范式(1
2012-09-08 00:22:00 608
转载 IBM ETL面试题
1.JOIN和LOOKUP的区别?这个简单,区别在于1)使用的缓存方式,JOIN是先内存,后磁盘,LOOKUP全放到内存中进行查找,2)默认的数据分区是不一样的JOIN是ROUND ROBIN,LOOKUP是ENTRY.3)使用的场景也不一样,JOIN用于数据量大的时候进行查找,LOOKUP只有在内存宽松的情况下进行查找.4)数据查找失败的方式也不一样.LOOKUP有REJEC
2012-09-04 22:48:40 1471
原创 MOIA--ETL服务管理平台软件
MOIA是一款B/S模式的界面化ETL服务管理平台软件,面向DW/BI应用领域的应用集成中间件产品,可以实现对企业DW/BI应用数据平台的应用数据管理,作业管理、任务调度和系统运行监控。SIT测试时一般会有两个账号:开发和监控账号。1.开发账号,用户可以导入需要调度的JOB或SP开发包(可以通过提供的EXCL模板填写物理JOB和MOIA中JOB的名称,一般默认两者一致),配置各个模块、实体
2012-04-24 23:25:37 15344
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人