关于kettle集群在单机上的测试可参考文档:http://www.cnblogs.com/inuyasha1027/p/3259402.html。
这里主要介绍服务器分布在不同主机上的情况。
一、Kettle的部署
不管是linux下还是windows下部署kettle前提是机器上都已安装JDK。其次把kettle的安装文件解压后即可。Windows下启动spoon.bat;linux下启动spoon.sh。
二、服务器介绍
本实验使用的服务器:
192.168.197.130 master
192.168.197.129 slave1
192.168.197.131 slave2
三、carte相关配置文件说明
本实验开启的四个carte服务,其中一台为Master另外三台为Slave,来实现在Kettle的Spoon中对mysql数据库中数据表读取后,以集群方式来执行排序的过程。
Carte的配置文件所在路径:/home/spark/kettlle/data-integration/pwd
(1)主服务器(carte-config-master-8080.xml)的配置内容为:
<slaveserver>
<name>master1</name>
<hostname>master</hostname>
<port>8080</port>
<master>Y</master>
</slaveserver>
其中master1表示以本机作为主服务器。
(2)子服务器(carte-config-8081.xml)的配置内容为:
<masters>
<slaveserver>
<name>master1</name>
<hostname>master</hostname>
<port>8080</port>
<username>cluster</username>
<password>cluster</password>
<master>Y</master>
</slaveserver>
</masters>
<report_to_masters>Y</report_to_masters>
<slaveserver>
<name>slave1-8081</name>
<hostname>slave1</hostname>
<port>8082</port>
<username>cluster</username>
<password>cluster</password>
<master>N</master>
</slaveserver>
其中 slave1为子服务器的用户名 用ip 也可以 鼓励用ip。
同样方式设定其他自服务器(carte-config-8082.xm)的配置内容。把更改好的windows下的pwd文件夹分别覆盖其他三个服务器上的相应文件夹。
四、carte服务开启
对于Windows运行:Carte.batIP address port
对于Linux运行:carte.shIP address port
图1所示启动windows上的主节点,并已启动成功。
./carte.sh master 8080
对应吧另外的两个也给启动了
五、在kettle图形界面中对集群进行设定
特别需要注意的是:服务器的名称一定要与pwd文件夹下面的配置文件属性所对应的值是一致的。所新建的子服务器一定要在pwd文件夹下面要有对应的配置文件才可以。
图5所示配置好的主节点,需要在“是服务器吗”选项勾选。
用户名密码 cluster cluster (在上面配置文件里面有)
另外几台 的也同样配好:
所示配置好的三个配置好的子节点,在”是主服务器吗?”这个选项中,因为它不是主服务器,所以不对其进行勾选。
然后搭建集群:
集群搭建完成
当你执行转换或job时 选择集群执行就可以了