kafka 可视化工具_免费开源的ETL工具Kettle,现已更名为Pentaho Data Integration

d0cf395d417d980b3f4860f8423caa50.png

Pentaho开源项目下载页面

以前说起开源免费的ETL工具,Kettle是我觉得最容易上手和在生产场景部署的工具了,我们在很多数据集成的项目中都使用Kettle来服务。后来Kettle商业化以后,改名叫Pentaho了,Pentaho推出了商业化的付费产品套件以及社区免费版本。其实Pentaho是指一系列数据集成、分析及报表工具的集合,Pentaho Data Integration(PDI)即为以前的Kettle。目前PDI的最新版本为8.3.

  • 开源项目下载地址:

https://sourceforge.net/projects/pentaho/files/

  • Pentaho官方网址:

https://www.hitachivantara.com/

  • Pentaho8.3新特性:

Pentaho 8.3的全新增强功能可帮助企业真正实现数据管理的现代化。这些增强功能可有力支持企业的数据操作运营(data operations)策略,缩小原始数据与商业洞察间的差距。此次功能增强包括:

1.升级的数据管道拖拽功能,使得数据的访问及融合更轻松

借助Hitachi Vantara与SAP新的连接器,Pentaho 8.3目前支持从SAP ERP和Business Warehouse中,对数据进行拖拽并进行混合、增加及卸载;以此提供对企业信息更深入的洞察,并实现数据分析的更多价值。

在AWS环境中,Amazon Kinesis可提供实时数据。通过新的Amazon Kinesis集成接口,AWS开发者能够在功能强大的Pentaho可视化环境中获取和处理流数据,而不再需要编写代码且避免了人工混合数据,工作量大大减少。

2.提升数据可视化,数据治理更方便

提升了与Hitachi Content Platform(HCP)的集成:HCP是行业领先的对象存储系统,旨在支持不断增加的大型内容储存需求,包括简单的文本文件、图像、视频,以及数十亿字节的数据库镜像。升级后,客户能够更轻松地读取、写入和更新HCP自定义元数据,使用系统元数据查询对象,使得数据搜索、治理及分析都更加方便。

流式数据血缘分析:搭载Pentaho 8.3后,对AMQP、JMS、Kafka和MQTT等主流协议的实时数据追踪将更加简便。

3.扩展的多云环境应用支持

AWS Redshift批量加载:当前,将数据从S3移动到Redshift的常规方式是通过重复的SQL脚本来进行批量加载编排。现在,利用Redshift批量加载功能,Redshift可实现自动加载,显著提高客户工作效率。同时,客户还可自行定义数据上传的策略及时间表。

Snowflake连接:Snowflake已迅速崛起为云数据仓库的主流平台之一。但在许多分析项目中,用户依然希望加入其它来源的数据,也包括其它云来源的数据。Pentaho 8.3可将Snowflake的数据同其他数据源进行混合、丰富并进行分析。除Snowflake外,客户还可以访问已支持Pentaho的云平台(如AWS、Google Cloud、Microsoft Azure)中的数据。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值