最新版kettle9.2连接CDH

第一步:kettle9.2下载

kettle下载官方网址,下载你需要的版本,我这边下载的是目前最新的9.2
在这里插入图片描述
下载完成后解压得到data-integration文件夹

第二步:获取hive jar包

在hiveserver服务器的

/opt/cloudera/parcels/CDH/lib/hive/lib

路径下下载所有hive开头的jar包,拷贝到本地

data-integration/lib

data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh61\lib

下(这里的cdh61会根据kettle版本不同有所不同,找到cdn开头的文件夹拷贝即可)。

第三步:获取客户端配置

在这里插入图片描述

在这里插入图片描述
在集群管理界面Cloudera Management中,找到下面的Hive,点击进入Hive–>操作–>下载客户端配置,下载出配置文件:hive-clientconfig.zip,解压后将以下文件拷至路径:

/data-integration/plugins/pentaho-big-data-plugin/hadoop-configurations/cdh61


在这里插入图片描述

最后一步:配置plugin.properties

将data-integration/plugins/pentaho-big-data-plugin下的plugin.properties文件中的active.hadoop.configuration配置指向你刚刚配置jar包的cdh文件夹,具体名字无所谓,和配置文件保持一致即可
在这里插入图片描述
配置完成后重启kettle项目
测试一下,连接成功!
在这里插入图片描述

ps

在配置过程中看到一些文章中讲到配置完成后也无法连接是因为kettle和cdh的版本不兼容导致。我没遇到这种情况,遇到这种情况的同学可以试着从这方面入手研究一下。
谢谢参阅~

  • 6
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle 9.2版本是数据集成工具Pentaho Data Integration (简称PDI)的最新版本之一,PDI是Pentaho公司的一款开源软件,它以ETL(数据抽取、转换和加载)为主,提供了强大的数据整合功能,是企业数据整合解决方案的首选工具之一。 Kettle 9.2版本在前一版本的基础上进一步改进了性能和功能,新增了更多的组件和插件,提高了整合的灵活性和处理效率。具体来说,Kettle 9.2版本包括以下几个方面的改进和优化: 1.数据集成和ETL方面:新增了许多新的组件,如:去重、join方式等,从而能够满足更广泛的ETL需求。 2.数据抓取和存储方面:优化了数据库组件,支持更多的数据库类型,并提高了效率;同时新增支持MongoDB、HDFS等存储类型的组件。 3.数据质量和数据分析方面:新增了更多的数据质量统计组件,如:无效行统计、数据错误统计等,并提高了数据分析的效率和质量。 4.界面和体验方面:Kettle 9.2版本的用户界面更加简单易用,用户可以更直观地了解整个数据集成和ETL流程,同时也支持更多的自定义选项。 综上所述,Kettle 9.2版本是数据整合工具PDI的最新版本,提供了更加丰富的功能和更高效的性能,并具有广泛的适用性和扩展性。对于需要进行大规模数据整合和ETL处理的企业和个人用户来说,Kettle 9.2版本是一款值得推荐的数据整合工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值