ETL工具
YULAN1
一切从零开始,慢慢积累,慢慢走,靠自己。
展开
-
数据仓库分层之辩
--转自:http://blog.itpub.net/post/14877/198599 数据仓库的分层可以算是数据仓库架构的子话题。在前段时间参与的一次讨论中,笔者发现其中争论的焦点集中在每一层的作用、特点、是否有必要存在等问题。其中,大家虽然一致提到某些相关概念,但各方的理解却并非完全一致。例如对于ODS是什么、维度建模是什么等问题的解读,都是如此。 不妨想想看:数据从分散而异构的数据源中转载 2014-12-16 17:24:26 · 707 阅读 · 0 评论 -
PowerCenter 基础
PowcerCenter 也是属于典型的 C/S 架构,分为服务器组件和客户端组件,服务端有三个服务: Informatica Service 、Integration Service 和 Repository Service ,客户端主要就是 RDWM 四个组件。客户端主要用于设计开发 WorkFlow ,而服务器则用于运行 WorkFlow 。以下是我整个学习过程中的一些心得体会: Po转载 2014-12-18 14:09:37 · 617 阅读 · 0 评论 -
ETL增量抽取方式
增量是以一个时间段为计量单位,记录该段时间内较以前增加的数据记录。 增量抽取是将该段时间内增长的记录查找出来。 增量抽取一般有三种抽取模式,用于捕获源系统新增的数据到系目标库中 1)、时间戳方式,要求源表中存在一个或多个字段(时间戳),其值随着新纪录的增加而不断增加,执行数据抽取时,程序通过时间戳对数据进行过滤,抽取结束后,程序记录时间戳信息。 2)、触发器方式。要求用户在转载 2014-12-18 11:21:00 · 810 阅读 · 0 评论