kettle(6.0)如何连接远程集群(CDH5.1)?

最新推荐文章于 2024-03-18 15:45:30 发布

狼辰

最新推荐文章于 2024-03-18 15:45:30 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/u014443793/article/details/53097602

版权

最近因为公司业务需要，刚刚接触了kettle.这不看不知道，一看才发现kettle的功能是在是太强大了，让我有种相见恨晚的感觉。由于主要是应用kettle与hadoop集群和hive连接进行数据处理。所以这里简单叙述下kettle与hadoop集群连接时的大致步骤:

1.双击kettle(即data-integeration)目录下的spoon.bat,启动kettle

2.kettle启动后，新建一个作业（job）。可以命名为load_hdfs

3.在load_hdfs中有个Hadoop cluster子项，右键->New cluster,创建一个新集群

4.在新集群创建面板上填写好各个组件的IP+Port等信息

5.点击“测试”按钮，测试新集群能否正常连接

一般若你的kettle刚安装还没有配置过的话，这里会报错显示连接失败。这是正常的，接下来我们就要在kettle包里配置一下相关信息

6.首先到{$KETTLE_HOME}/plugins/pentaho-big-data-plugin/目录下找到名为plugin.properties的配置文件，并用notepad++（不一定非得用notepad++，只要是能打开此类文本的编辑器都可以）打开。文件位置和内容如下图所示：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

狼辰

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

kettle设置远程调试

bewilderment的专栏

05-27

2119

翻译自：http://ramathoughts.blogspot.com/2010/07/setup-kettle-debugging-in-2-minutes.html 设置kettle允许远程调试： 1) Windows系统, 打开Spoon.bat添加： set JAVA_OPTS=-Xdebug -Xrunjdwp:transport=dt_socket,address

PDI（kettle）兼容hadoop-连接CDH hadoop集群

果果的小莴笋

02-16

2545

1. 说明 PDI可以与Hadoop协同工作。通过提交适当的参数，Kettle可以连接Hadoop的HDFS、MapReduce、Zookeeper、Oozie、Sqoop和Spark服务。在数据库连接类型中支持Hive、Impala和Hbase PDI获取：https://sourceforge.net/projects/pentaho/files/Pentaho-9.2/client-tools/ PDI server 获取：https://sour...

1 条评论您还未登录，请先登录后发表或查看评论

entaho Kettle 连接 CDH Hive

xiaoyaGrace的博客

11-18

392

关键点:清理Kettle缓存: rm -rf/home/user/data-integration/./system/karaf/caches rm -rf/home/user/data-integration/./system/karaf/data ...

配置kettle连接CDH集群的HiveServer

小陌成长之路

03-23

2665

配置kettle连接CDH集群的HiveServer

设置Kettle7.1接CDH hadoop集群

m0_37845836的博客

11-07

1370

在开始之前，你需要做一些事情。验证支持检查组件引用，以验证您的Kettle7.1版本支持您的MAPR集群版本。建立MAPR集群 Kettle7.1可以连接到安全的和不安全的MAPR集群。配置MAPR集群。如果需要帮助，请参阅MapR的文档。安装任何必需的服务和服务客户端工具。测试群集。设置MapR客户端安装MapR客户机，然后进行测试，以确保它正确地安装在...

etl工具-kettle6.0

04-14

在Kettle 6.0版本中，它带来了许多增强功能和改进，以提升数据处理的效率和用户体验。 1. **工作流与转换**：Kettle的工作流程（Job）和转换（Transformation）是其两大核心概念。工作流用于管理和调度多个转换，而...

kettle6.0 连接oracle11g,Kettle表输出报关闭的连接问题的解决方法

weixin_39949506的博客

04-11

1549

最近在使用Kettle的时候表输出有时候会报一个错误关闭的连接在网上查了半天都没有找到解决办法现在记录一下解决过程以备后用。1.软件环境-Oracle 11g R2 RAC-Kettle6.0.1.0-JDK 1.68-Oracle Driver OJDBC14.jar2.报错如下2016/06/23 16:53:30 - 表输出 2.0 - ERROR (version 6.0.1.0-3...

kettle 6.0安装并连接ORACLE,HADOOP CDH5.3.0以及hadoop客户端配置

jajavaja的专栏

12-16

5923

到官网下载下载完毕后解压,记得本机要有java环境并配置好运行spoon.bat在linux下运行spoon.sh,亲测win7/centos6可以用新建转换,选择输入拖出表输入,输出拖出表输出双击设置点击新建,建立一个oracle新连接配置好后点击测试可以测试一下显示测试成功点

kettle6.0linux安装配置

小码农的专栏

10-24

5983

kettle kettle部署分为kettle server部署和客户端的kettle client部署，二者安装包完全一致，除因为不同操作系统执行相对应的脚本文件外(linux执行shell文件，windows执行bat文件)，其它配置基本一致。 kettle版本：6.0,下载地址：http://sourceforge.net/projects/pentaho/files/Data%

kettle集群（cluster）在多个服务器上并发执行

07-29

kettle集群（cluster）在多个服务器上并发执行，文档详细移动，通过测试成功

kettle的并行_集群和分区

11-07

kettle的并行_集群和分区当你有很多数据要处理的时候，能够有效地使用所有的计算资源是非常重要的。不管是台个人电脑，还是有数百台服务器，你都想让Kettle能尽可能的使用所有可用的计算资源，并在可接受的时间范围内获取执行结果。在这一章节，我们将解开kettle的转换和作业在垂直扩展和水平扩展方面的秘密。垂直扩展是尽可能的使用单台服务器上的多CPU核。水平扩展是使用多台机器资源，使他们并行计算。这两种方法都是ETL子系统的一部分（#31，并行/流水线系统）。章节的第一部分先谈谈转换内部的并行机制和多种使用其进行垂直扩展的方法。然后我们讲解怎样在子服务器集群环境下进行水平扩展转换。

KETTLE远程执行

02-20

kettle 远程执行，使用carte.bat，建立子服务器，并在本地使用命令行的方式调用

KETTLE安装以及远程资源库部署

weixin_48277834的博客

03-18

624

将下文写入/etc/profile。

登陆远程kettle

sinat_40049561的博客

11-20

569

cd /kettle-7.1/data-integration/ ./spoon.sh

kettle开发-Day42-远程执行作业

qq_29061315的博客

08-25

1998

从kettle的远程执行，来深度解析kettle背后集群的原理

kettle安装实现windows远程调度linux上的kettle

xx1132856201的博客

08-14

3413

kettle安装实现windows远程调度linux上的kettle 准备：一台windows服务器，一台linux服务器，数据库（作为kettle的工程库）， kettle安装包（win和linux通用） windows安装kettle 解压kettle安装包到安装目录，找到spoon.bat，打开编辑将红框中参数改为512、512、256，不改可能出现卡顿。改完参数保存，双击spoon.bat运行spoon，会在用户根目录（c:/→用户→User）下生成.kettle文件夹，里面有reposi

KETTLE远程服务--学习笔记1

weixin_42162388的博客

02-25

532

1,首先，输入cmd–>D:\data-integration\Carte.bat localhost 9111–>enter 注：重点是找到Carte.bat这个文件地址，然后空格，在其后输入localhost 和端口号端口号可以写其他，（有时候写8080可能会有被占用的错误），最后一行能看到端口号表示运行成功，即远程服务已经启动。 2，运行Spoon.bat，建立一个资源库，然后新建一个转换(或者使用资源库里面的转换)，然后在左侧子服务器中新建一个服务器，最后运行选择远程执行，最后执行

kettle系列之五kettle远程执行和调度

weixin_40479337的博客

05-07

1531

参考 http://www.cnblogs.com/John-Young/p/6349252.html https://wenku.baidu.com/view/fb20216858fafab...

kettle6.0下载