六种 主流ETL 工具的比较(DataPipeline,Kettle,Talend,Informatica,Datax ,Oracle Goldengate)

六种 主流ETL 工具的比较(DataPipeline,Kettle,Talend,Informatica,Datax ,Oracle Goldengate)

比较维度\产品DataPipelinekettleOracle GoldengateinformaticatalendDataX
设计及架构适用场景主要用于各类数据融合、数据交换场景,专为超大数据量、高度复杂的数据链路设计的灵活、可扩展的数据交换平台面向数据仓库建模传统ETL工具主要用于数据备份、容灾面向数据仓库建模传统ETL工具面向数据仓库建模传统ETL工具面向数据仓库建模传统ETL工具
使用方式全流程图形化界面,应用端采用B/S架构,Cloud Native为云而生,所有操作在浏览器内就可以完成,不需要额外的开发和生产发布C/S客户端模式,开发和生产环境需要独立部署,任务的编写、调试、修改都在本地,需要发布到生产环境,线上生产环境没有界面,需要通过日志来调试、debug,效率低,费时费力没有图形化的界面,操作皆为命令行方式,可配置能力差C/S客户端模式,开发和生产环境需要独立部署,任务的编写、调试、修改都在本地,需要发布到生产环境;学习成本较高,一般需要受过专业培训的工程师才能使用;C/S客户端模式,开发和生产环境需要独立部署,任务的编写、调试、修改都在本地,需要发布到生产环境;DataX是以脚本的方式执行任务的,需要完全吃透源码才可以调用,学习成本高,没有图形开发化界面和监控界面,运维成本相对高。
底层架构分布式集群高可用架构,可以水平扩展到多节点支持超大数据量,架构容错性高,可以自动调节任务在节点之间分配,适用于大数据场景主从结构非高可用,扩展性差,架构容错性低,不适用大数据场景可做集群部署,规避单点故障,依赖于外部环境,如Oracle RAC等;schema mapping非自动;可复制性比较差;更新换代不是很强支持分布式部署支持单机部署和集群部署两种方式
功能CDC机制基于日志、基于时间戳和自增序列等多种方式可选基于时间戳、触发器等主要是基于日志基于日志、基于时间戳和自增序列等多种方式可选基于触发器、基于时间戳和自增序列等多种方式可选离线批处理
对数据库的影响基于日志的采集方式对数据库无侵入性对数据库表结构有要求,存在一定侵入性源端数据库需要预留额外的缓存空间基于日志的采集方式对数据库无侵入性有侵入性通过sql select 采集数据,对数据源没有侵入性
自动断点续传支持不支持支持不支持,依赖ETL设计的合理性(例如T-1),指定续读某个时间点的数据,非自动不支持,依赖ETL设计的合理性(例如T-1),指定续读某个时间点的数据,非自动不支持
监控预警可视化的过程监控,提供多样化的图表,辅助运维,故障问题可实时预警依赖日志定位故障问题,往往只能是后处理的方式,缺少过程预警无图形化的界面预警monitor可以看到报错信息,信息相对笼统,定位问题仍需依赖分析日志有问题预警,定位问题仍需依赖日志依赖工具日志定位故障问题,没有图形化运维界面和预警机制,需要自定义开发。
数据清洗围绕数据质量做轻量清洗围绕数据仓库的数据需求进行建模计算,清洗功能相对复杂,需要手动编程轻量清洗支持复杂逻辑的清洗和转化支持复杂逻辑的清洗和转化需要根据自身清晰规则编写清洗脚本,进行调用(DataX3.0 提供的功能)。
数据转换自动化的schema mapping手动配置schema mapping需手动配置异构数据间的映射手动配置schema mapping手动配置schema mapping通过编写json脚本进行schema mapping映射
特性数据实时性实时非实时实时支持实时,但是主流应用都是基于时间戳等方式做批量处理,实时同步效率未知实时定时
应用难度
是否需要开发
易用性
稳定性
其他实施及售后服务原厂实施和售后服务开源软件,需自客户自行实施、维护原厂和第三方的实施和售后服务主要为第三方的实施和售后服务分为开源版和企业版,企业版可提供相应服务阿里开源代码,需要客户自动实施、开发、维护

转载于:https://www.cnblogs.com/DataPipeline2018/p/11131723.html

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值