ETL工具比较

Kettle 与 Talend Open Studio 的 ETL 比较

Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。

      Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。

      两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码。

 

学习曲线、易用性以及文档

      Pentaho Kettle 和 Talend Open Studio 都是用户友好型工具。它们都拥有优秀的数据和数据库管理背景(JDBC,SQL,文件格式化,编程基础,等等),成为高产能的工具指日可待。 

      Kettle 和 Talend 都提供图形化工具使工作更加简便快捷。这些工具可以帮助您迅速设计并测试出可靠的 ETL 流程。

      Pentaho Kettle 学起来十分简单,但与 Talend 的产品相比功能略少。Talend Open Studio 更难掌握,但是一旦您熟悉的它的 IDE,您就可以享受到这个工具强大的灵活与效力。使用 Talend Open Studio 的一个要求是正确定义您要处理的数据的 schema,在这个工程中,它的 IDE 大有助益。而在这一点上,Kettle 限制更少,因此您可以更快地建立起流程来。而且定义元数据对 Talend 来说是一个重要的功能,因为这会帮助您在生产环境中做出更可靠的流程。

      Talend Open Studio 和 Pentaho Kettle 都是用户友好型,拥有丰富文档和强大社区支持的产品。只不过 Talend Open Studio 需要您投入稍大的精力来熟悉。但是,一旦您入门了,您就可以享受到这个工具的强大和潜力。

 

可靠、成熟、技术支持

      Talend 和 Pentaho 都有强大的社区支持,而且都是强大、知名的的企业。开源商务智能是不断发展,而实际使用中的应用程序正变得越来越相同。 
      在这个背景下,Talend 和 Pentaho 都提供了它们的开源 ETL 工具,并得到了广泛地使用。它们在实际使用中发展,同商用软件一样以任务为功能实现的核心。 
      Talend 更专注于数据集成和数据管理解决方案(当然,现在还要加上 SOA),然而 Pentaho 主要集中于商务智能。Talend Open Studio 得到了 Talend 非常活跃地开发,而且该公司已经建立了一个丰富的数据集成生态系统,而 Kettle 是 Pentaho 的一个重要项目,只是比起 Talend 的产品,开发与扩展方面还稍逊一筹。 

      Pentaho 和 Talend 的解决方案都非常可靠,成熟,而且发展迅速。实际运用中两者实现的功能有所趋同。经由订阅您可以获得支持服务,也可以按照需求取得直接的咨询服务。

组件、技术与功能

      Talend Open Studio 是基于 Eclipse 的 Java 工具。您在图形化编辑器中设计的流程可以使用 Java 语言编译。此时,您可以轻松地使用 Java 全部的生态系统 
      Talend Open Studio 的组件种类和具有的功能非常丰富,既有通用工具,也有专用工具。在通用工具中,Talend 配备了一套 RDBMS 组件,通过它们您很快就可以掌握某个特定 DB 厂商的高级功能。您可以将用到的定义储存在多个不同的存储库(repository)中,从而在项目发展中使用这些定义。 
      Pentaho Data Integration (Kettle) 使用 Java (Swing)开发。Kettle 作为编译器对 XML 格式书写的流程进行编译。这些功能和组件比起 Talend 在丰富性方面稍逊一些,但是您建立复杂 ETL 流程需要的一切元素。Kettle 的 JavaScript 引擎(和 Java 引擎)可以深层地控制对数据的处理。 

      Talend 功能更加丰富,比起 Kettle 拥有更加灵活的技术特点。通过 Talend,您可以轻松地使用完整的 Java 生态和一些DB厂商提供的专用的DB功能。Kettle 工具也很优秀,同时更加专注于 ETL 功能。 

其它ETL工具

1、 KETL     
    KETL 是首屈一指的,开源的 ETL 工具。数据集成平台是建立与便携式,基于 Java 的体系结构和开放的,基于 XML 的配置和工作语言。  KETL 功能可以成功地与主要商业产品竞争今日。
· 授权协议:  LGPL/GPL
· 开发语言:  Java
· 操作系统: 跨平台

2Palo ETL Server 
       Palo ETL Server  是一个  Java  的工具用来对数据进行抽取、转换和加载到  Palo OLAP Server  中,该项目已经整合到  Palo BI Suite  中,并且不再更新。
· 授权协议: 未知
· 开发语言:  Java
· 操作系统: 跨平台

3Scriptella
        Scriptella  是一个开源的  ETL  (抽取 - 转换 - 加载)工具和一个脚本执行工具,采用  Java  开发。
任务配置示例
<!DOCTYPE etl SYSTEM "http://scriptella.javaforge.com/dtd/etl.dtd">
<etl>
    <connection driver="$driver" url="$url" user="$user" password="$password"/>
    <script>
        <include href="PATH_TO_YOUR_SCRIPT.sql"/>
        -- And/or directly insert SQL statements here
    </script>
</etl>
授权协议:  Apache
开发语言:  Java
操作系统: 跨平台

4Enhydra Octopus
      Enhydra Octopus  是一个基于  Java  开发的数据 ETL (抽取、转换和加载)工具,可以连接到兼容 JDBC 的数据库并根据 XML 定义文件对数据进行抽取和处理。

· 授权协议:  GPL
· 开发语言:  Java
· 操作系统: 跨平台

5Apatar  
       Apatar 是一个开源的数据抽取、转换、 装载( ETL )项目。模块化的架构。提供可视化的 Job 设计器与映射工具,支持所有主流数据源,提供灵活的基于  GUI 、服务器和嵌入式的部署选项。
· 授权协议:  GPL
· 开发语言:  Java
· 操作系统: 跨平台

6Talend (踏蓝)
       Talend ( 踏蓝 ) 是第一家针对的数据集成工具市场的 ETL( 数据的提取 Extract 、传输 Transform 、载入 Load) 开源软件供应商。
Talend 以它的技术和商业双重模式为 ETL 服务提供了一个全新的远景。它打破了传统的独有封闭服务,提供了一个针对所有规模的公司的公开的,创新的,强大的灵活的软件解决方案。最终,由于 Talend 的出现,数据整合方案不再是被大公司所独享。
· 授权协议: GPL
· 开发语言: Java
· 操作系统: 跨平台

7CloverETL
ETL  是一切数据仓库应用的基础。 CloverETL  是一个基于  Java  的开源的  ETL  框架,同时还包含了一个  ETL 设计器 ——CloverETL Designer。核心的算法就是一个数据流网络。

一 ETL工具
【国外】

1. datastage
点评:最专业的ETL工具,价格不菲,使用难度一般

下载地址:ftp://ftp.seu.edu.cn/Pub/Develop ... taStage.v7.5.1A-iSO

BT种子下载:http://pan.baidu.com/share/link?shareid=172289&uk=67437475

---------------------------------------

2. informatica
点评:专业程度如Datastage旗鼓相当,价格似乎比Datastage便宜。

Informatica PowerCenter 8.6.1 for Win 32Bit

服务端下载:http://pan.baidu.com/share/link?shareid=183214&uk=67437475
客户端下载:http://pan.baidu.com/share/link?shareid=183217&uk=67437475

Informatica PowerCenter 8.6.0 for Win 32Bit
BT种子下载:http://pan.baidu.com/share/link?shareid=172290&uk=67437475

Informatica PowerCenter 8.1.1 for Win 32Bit
安装包下载:http://pan.baidu.com/share/link?shareid=183201&uk=67437475
---------------------------------------

3. kettle
点评:业界最有名的开源ETL工具。开源当然就免费,免费的有些东西使用就不是很方便。

下载地址:http://kettle.pentaho.com/

---------------------------------------

4. ODI
点评:oracle数据库厂商提供的工具,有局限性,与oracle数据库耦合太深。

下载地址: www.oracle.com/technetwork/cn/testcontent/index-091026-zhs.html

---------------------------------------

5.Cognos

下载地址:http://www.ibm.com/developerworks/cn/downloads/im/cognosbi/

Cognos BI 8.3

BT种子下载: http://pan.baidu.com/share/link?shareid=172287&uk=67437475

Cognos BI 8.4 
BT种子下载:http://pan.baidu.com/share/link?shareid=172288&uk=67437475

------------------------------------------
【国内】
6. beeload
点评: 最好的国产ETL工具,但产品化程度还有一定距离。

下载地址: www.livbee.com
---------------------------------------

二 专业调度工具
有人说: ETL是BI的基础,而调度是ETL的灵魂,可见调度的重要性!
调度原本是ETL技术的一个分支,但这些年, 调度越来似乎有走独立工具的趋势。虽然在ETL工具有调度功能,但与独立调度工具相比,ETL工具的调度就显得很弱了。

【国外】
1. Control-M
点评:你当了大哥太多年,确实有点寂寞。不论是你的规模、价格、使用难度,都很伟大,但我一界平民,你对我只是传说。

官网地址:www.bmc.com

--------------------------------------

【国内】

2. taskctl
点评:调度新秀。专业,而且设计独特、体验友好。易安装、易使用,看好其前景。
下载地址:http://www.taskctl.com/html/2012 ... 8b57714a50a15a.html

--------------------------------------

3. ETS
点评:专业化有待提升
官网地址:http://www.etlschedule.com/

--------------------------------------

4. Moia
点评:产品与项目是有区别的,不要总是在产品化与客户化之间徘徊。
官网地址:http://www.adtec.com.cn/_d271218319.htm
--------------------------------------

5. ETL-Plus
点评:功能全,遗憾的是东南倒塌。
下载地址:[无]

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值