- 博客(7)
- 收藏
- 关注
转载 ETL架构师面试题
1. What is a logical data mapping and what does it mean to the ETL team?什么是逻辑数据映射?它对ETL项目组的作用是什么?答:逻辑数据映射(Logical Data Map)用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的数据转换到数据仓库中需要做操作和处理方式的说明文档,通常以表格或Exce
2013-04-12 10:41:28
291
转载 oracle SQL里常用的时间函数
常用日期型函数 1。Sysdate 当前日期和时间SQL> Select sysdate from dual; SYSDATE----------21-6月 -05 2。Last_day 本月最后一天 SQL> Select last_day(sysdate) from dual; LAST_DAY(S
2013-03-24 22:24:39
419
转载 Datastage 中Transformer Stage:各个函数的解析
Transformer Stage:各个函数的意义:Date$Time函数名称 测试用列 描述 测试结果 CurrentDate CurrentDate() 获取系统当天日期 2008-08-05 CurrentTime CurrentTime() 获取系统当天时间 17:52:31 CurrentTimestamp
2013-03-24 22:23:27
381
转载 ETL中的数据增量抽取机制研究
0 引 言 增量抽取是数据仓库ETL(extraction,transformation,loading,数据的抽取、转换和装载)实施过程中需要重点考虑的问题。在ETL过程中,增量更新的效率和可行性是决定ETL实施成败的关键问题之一,ETL中的增量更新机制比较复杂,采用何种机制往往取决于源数据系统的类型以及对增量更新性能的要求。本文不就某个ETL增量抽取的具体机制作深入探讨,重点对各
2013-03-24 21:34:41
479
转载 浅析异构数据抽取
Describe techniques for extracting from heterogeneous data sources.简述异构数据源中的数据抽取技术。答:在数据仓库项目中,需要抽取的数据经常来自不同的数据源,它们的逻辑结构和物理结构都可能不同,即称之为异构数据源。在对异构数据源进行整合抽取时,我们需要做的事情依次是标识出所有的源系统,对源系统进行概况分析,定
2013-03-24 21:29:06
360
转载 浅析代理键替换管道
What are surrogate keys? Explain how the surrogate key pipeline works.什么是代理键?简述代理键替换管道如何工作。答:在维度表的迁移过程中,有一种处理方式是使用无意义的整型值分配给维度记录并作为维度记录的主键,这些作为主键的整型值称为代理键(Surrogate Key)。使用代理键有很多好处,如隔离数据仓库与操作环
2013-03-24 21:26:39
341
转载 常见etl面试题目
1.JOIN和LOOKUP的区别?这个简单,区别在于1)使用的缓存方式,JOIN是先内存,后磁盘,LOOKUP全放到内存中进行查找,2)默认的数据分区是不一样的JOIN是ROUND ROBIN,LOOKUP是ENTRY.3)使用的场景也不一样,JOIN用于数据量大的时候进行查找,LOOKUP只有在内存宽松的情况下进行查找.4)数据查找失败的方式也不一样.LOOKUP有REJEC
2013-03-24 21:12:39
3758
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人