数据提取、转换和加载 - ETL工具

原创 2016年06月01日 10:54:27

ETL,Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。 ETL工具有:OWB(Oracle Warehouse Builder)、ODI(Oracle Data Integrator)、Informatic PowerCenter、AICloudETL、DataStage、Repository Explorer、BeeloadKettle、DataSpider


ETL负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库数据集市中,成为联机分析处理、数据挖掘的基础。


编辑ETL应用

目前,ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS、BeeloadKettle……
开源的工具有eclipse的etl插件。cloveretl.

数据集成平台必须支持数据集成生命周期中的所有五个关键步骤:访问、发现、 清洗、集成和交付

数据集成平台必须足够可靠、灵活和可扩展,以处理任何一类型的数据集成项目,其中包括:
测试数据管理和存档 ·
B2B Data Exchange ·

主流ETL产品:

Ascential公司的Datastage(Datastage在2005年被IBM收购)、

Informatica公司的Powercenter、

 NCR Teradata公司的ETL Automation(一套ETL框架、主要关注“抽取”)。


ETL工具有:

OWB(Oracle Warehouse Builder)、

ODI(Oracle Data Integrator)、

Informatic PowerCenter(Informatica公司)、

AICloudETL、
DataStage(Ascential公司)、

Repository Explorer、Beeload、Kettle、DataSpider、ETL Automation(NCR Teradata公司)、

Data Integrator(Business Objects公司)、DecisionStream(Cognos公司)

一 ETL工具

【国外】

1. datastage
点评:最专业的ETL工具,价格不菲,使用难度一般

下载地址:ftp://ftp.seu.edu.cn/Pub/Develop ... taStage.v7.5.1A-iSO

BT种子下载:http://pan.baidu.com/share/link?shareid=172289&uk=67437475

---------------------------------------

2. informatica
点评:专业程度如Datastage旗鼓相当,价格似乎比Datastage便宜。

Informatica PowerCenter 8.6.1 for Win 32Bit

服务端下载:http://pan.baidu.com/share/link?shareid=183214&uk=67437475
客户端下载:http://pan.baidu.com/share/link?shareid=183217&uk=67437475

Informatica PowerCenter 8.6.0 for Win 32Bit
BT种子下载:http://pan.baidu.com/share/link?shareid=172290&uk=67437475

Informatica PowerCenter 8.1.1 for Win 32Bit
安装包下载:http://pan.baidu.com/share/link?shareid=183201&uk=67437475
---------------------------------------

3. kettle
点评:业界最有名的开源ETL工具。开源当然就免费,免费的有些东西使用就不是很方便。

下载地址:http://kettle.pentaho.com/

---------------------------------------

4. ODI
点评:oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。

下载地址: www.oracle.com/technetwork/cn/testcontent/index-091026-zhs.html

---------------------------------------

5.Cognos

下载地址:http://www.ibm.com/developerworks/cn/downloads/im/cognosbi/

Cognos BI 8.3

BT种子下载: http://pan.baidu.com/share/link?shareid=172287&uk=67437475

Cognos BI 8.4 
BT种子下载:http://pan.baidu.com/share/link?shareid=172288&uk=67437475

------------------------------------------
国内:
6. beeload
点评: 最好的国产ETL工具,但产品化程度还有一定距离。

下载地址: www.livbee.com

二 专业调度工具
ETL是BI的基础,调度是ETL的灵魂,调度原本是ETL技术的一个分支, 调度越来似乎有走独立工具的趋势。虽然在ETL工具有调度功能。

国外:
1. Control-M


官网地址:www.bmc.com

国内:

2. taskctl
下载地址:http://www.taskctl.com/html/2012 ... 8b57714a50a15a.html

3. ETS
官网地址:http://www.etlschedule.com/

4. Moia
官网地址:http://www.adtec.com.cn/_d271218319.htm

5. ETL-Plus


支持向量机(五)SMO算法

SMO算法由Microsoft Research的John C. Platt在1998年提出,并成为最快的二次规划优化算法,特别针对线性SVM和数据稀疏时性能更优。关于SMO最好的资料就是他本人写的《Sequential Minimal Optimization A Fast Algorithm for Training Support Vector Machines》了


ETL中的数据增量抽取机制

增量抽取是数据仓库ETL(extraction,transformation,loading,数据的抽取、转换和装载)实施过程中需要重点考虑的问题。在ETL过程中,增量更新的效率和可行性是决定ETL实...

jdbc操作 数据库做同步,全量+增量,线程控制,批处理

数据库做同步,全量+增量
  • Gooooa
  • Gooooa
  • 2017年02月08日 11:24
  • 1277

ETL 数据提取、转换和加载

ETL,Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载。 ETL工具有:OWB(Oracle Warehouse Builder)、ODI(O...

数据仓库应用(二):数据抽取、转换、加载(ETL)

某电子商务网站主要销售电子类产品,产品又分为几个大类别,包括:电脑类、手机类、键盘类等,每个类别内又细分为几个小类别,各类别下又有诸多的商品,每一个商品都有一个唯一的商品编号。用户可以通过注册成为会员...

Android实用视图动画及工具系列之二:Toast对话框和加载载入对话框

Android实用视图动画及工具系列之二:Toast对话框和载入对话框,类似Toast底色的弹出对话框和加载对话框,主要实现弹出和提示消息的功能,对话框可以实现不被取消,主要功能原理利用了安卓逐帧动画...

自己封装的工具类,使用原生SwipeRefreshLayout+RecycleView实现下拉刷新和加载更多

实现SwipeRefreshLayout+RecycleView实现刷新在你的xml文件里写上如下代码:

python读取文本文件URL列表遇到的问题和加载中数据获取问题

微博舆情的分析,最首要的工作是获取微博原始数据,所以最近在爬取微博数据,昨天遇到一个问题,就是当抓取指定URL用户的微博信息时,如果采用查看源码的方式,只能获取15条微博,后面的微博是延时显示的,一页...

easyui-datagrid---动态创建表头和加载数据

效果  要实现动态的创建表头,即表头的格式多样,比如列数不确定,表头的总分结构等。下图为表头最终效果: 实现  想要动态的实现创建表头,那么用html的方式去创建easyui-datagrid肯定是...
  • FreeApe
  • FreeApe
  • 2015年11月24日 18:27
  • 4627

Unity3D笔记第二十二天——数据存储,资源管理和加载

数据存储 PlayerPrefs 游戏存档 作用:在游戏会话中储存和访问游戏存档。 存储路径: Mac OS X: ~/Library/Preferences/Unity/WebPlayerP...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:数据提取、转换和加载 - ETL工具
举报原因:
原因补充:

(最多只允许输入30个字)