巨杉大学SVP专家分享 | Apache Hop基于web的可视化流式批处理

Apache Hop,源自Kettle,是一个基于web的可视化流式批处理平台,提供广泛的工具,包括元数据分析和审计服务。与Kettle相比,Hop更注重项目组织和生命周期管理,支持发布到不同引擎执行,且提供了WebSpoon设计端。Hop目前在持续优化中,目标是增强插件、测试和版本管理功能。
摘要由CSDN通过智能技术生成

01 前言

近年来,随着互联网技术的发展,数据早已成为各行业的生命源泉,数据管理的重要性不言而喻。日前,在「巨杉最具价值专家」技术交流会中,北京傲飞商智软件有限公司CEO初建军老师( jianjunchu@apache.org)对Apache Hop基于web的可视化流式批处理平台主题进行了详细的讲解。

02 什么是Apache Hop

Apache Hop是Hop Orchestration Platform的缩写。它完全用Java编写,旨在提供广泛的数据编排工具,包括可视化开发环境,服务器,元数据分析,审计服务等。作为一个平台,Hop还希望成为一个可重复使用的库,以便可以被其他软件轻松地重复使用。

Hop起源于Kettle, Kettle 作为一款国外开源的 ETL 工具,抽取数据高效稳定,在执行ETL工具、ETL数据抽取转换等批任务时,使用频率较高。近几年,国内包括电信、金融、银行在内的各行业都使用 Kettle 作为数据处理工具。但是由于各种因素,Kettle近几年的发展还是较为缓慢,为了改变现况,从今年2月份开始,Kettle 社区在Kettle 8.2的基础上建立了一个分支,Hop就是从这个分支建立的新项目,2020年9月份,Hop正式加入Apache,成为Apache的孵化项目。

03 Hop与Kettle的区别

由于Hop源于Kettle,所以Hop的概念与Kettle十分相似。Kettle中的转换、步骤、作业、作业项等在Hop里面都有相对应的名称,如下表所示,转换在Hop中对应的是pipeline,pipeline起

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值