自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(7)
  • 收藏
  • 关注

转载 ETL架构师面试题

1. What is a logical data mapping and what does it mean to the ETL team?什么是逻辑数据映射?它对ETL项目组的作用是什么?答:逻辑数据映射(Logical Data Map)用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的数据转换到数据仓库中需要做操作和处理方式的说明文档,通常以表格或Exce

2013-04-12 10:41:28 291

转载 oracle SQL里常用的时间函数

常用日期型函数 1。Sysdate 当前日期和时间SQL> Select sysdate from dual; SYSDATE----------21-6月 -05 2。Last_day 本月最后一天 SQL> Select last_day(sysdate) from dual; LAST_DAY(S

2013-03-24 22:24:39 419

转载 Datastage 中Transformer Stage:各个函数的解析

Transformer Stage:各个函数的意义:Date$Time函数名称 测试用列 描述 测试结果 CurrentDate CurrentDate() 获取系统当天日期 2008-08-05 CurrentTime CurrentTime() 获取系统当天时间 17:52:31 CurrentTimestamp

2013-03-24 22:23:27 381

转载 ETL中的数据增量抽取机制研究

0 引 言    增量抽取是数据仓库ETL(extraction,transformation,loading,数据的抽取、转换和装载)实施过程中需要重点考虑的问题。在ETL过程中,增量更新的效率和可行性是决定ETL实施成败的关键问题之一,ETL中的增量更新机制比较复杂,采用何种机制往往取决于源数据系统的类型以及对增量更新性能的要求。本文不就某个ETL增量抽取的具体机制作深入探讨,重点对各

2013-03-24 21:34:41 479

转载 浅析异构数据抽取

Describe techniques for extracting from heterogeneous data sources.简述异构数据源中的数据抽取技术。答:在数据仓库项目中,需要抽取的数据经常来自不同的数据源,它们的逻辑结构和物理结构都可能不同,即称之为异构数据源。在对异构数据源进行整合抽取时,我们需要做的事情依次是标识出所有的源系统,对源系统进行概况分析,定

2013-03-24 21:29:06 360

转载 浅析代理键替换管道

What are surrogate keys? Explain how the surrogate key pipeline works.什么是代理键?简述代理键替换管道如何工作。答:在维度表的迁移过程中,有一种处理方式是使用无意义的整型值分配给维度记录并作为维度记录的主键,这些作为主键的整型值称为代理键(Surrogate Key)。使用代理键有很多好处,如隔离数据仓库与操作环

2013-03-24 21:26:39 341

转载 常见etl面试题目

1.JOIN和LOOKUP的区别?这个简单,区别在于1)使用的缓存方式,JOIN是先内存,后磁盘,LOOKUP全放到内存中进行查找,2)默认的数据分区是不一样的JOIN是ROUND ROBIN,LOOKUP是ENTRY.3)使用的场景也不一样,JOIN用于数据量大的时候进行查找,LOOKUP只有在内存宽松的情况下进行查找.4)数据查找失败的方式也不一样.LOOKUP有REJEC

2013-03-24 21:12:39 3758

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除