kettle集群

最新推荐文章于 2024-07-18 15:51:03 发布

liu_li_bin

最新推荐文章于 2024-07-18 15:51:03 发布

阅读量4k

点赞数

文章标签：集群服务器 schema 作业 socket sockets

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liu_li_bin/article/details/5640062

版权

Kettle集群允许转换在多个服务器上并发执行，通过定义Cluster schema和转换来实现。集群设计包括创建子服务器和Cluster schema，转换定义需指定集群执行。执行转换涉及启动子服务器，如使用Carte web服务器，通过脚本或程序启动。转换运行可以在Spoon中图形化操作，也可编程执行。Kettle通过分解转换、提交、准备和启动在子服务器上执行分布式处理。

摘要由CSDN通过智能技术生成

Kettle中的集群

目录

Kettle中的集群... 1

1 设计... 2

1.1 定义Cluster schema. 2

1.2 定义转换. 5

2 执行转换... 7

2.1 启动子服务器. 7

2.1.1 脚本启动... 7

2.1.2 程序启动... 9

2.1.3 子服务器内幕... 10

2.2 运行转换. 12

2.2.1 在spoon中运行... 12

2.2.2 编程运行... 13

2.2.3 运行内幕... 13

Kettle是一款开源的ETL工具，以其高效和可扩展性而闻名于业内。其高效的一个重要原因就是其多线程和集群功能。

Kettle的多线程采用的是一种流水线并发的机制，我们在另外的文章中专门有介绍。这里主要介绍的是kettle的集群。

集群允许转换以及转换中的步骤在多个服务器上并发执行。在使用kettle集群时，首先需要定义的是Cluster schema。所谓的Cluster schema就是一系列的子服务器的集合。在一个集群中，它包含一个主服务器（Master）和多个从属服务器服务器(slave)。如下图所示。

子服务器（Slave servers）允许你在远程服务器上执行转换。建立一个子服务器需要你在远程服务器上建立一个叫做“Carte”的 web 服务器，该服务器可以从Spoon(远程或者集群执行)或者转换任务中接受输入。

在以后的描述中，如果我们提到的是子服务器，则包括集群中的主服务器和从属服务器；否则我们会以主服务器和从属服务器来进行特别指定。

1 设计

要让转换是以集群方式执行，首先需要在Spoon中进行图形化的设计工作。定义一个以集群方式运行的转换，主要包括定义cluster schema和定义转换两个步骤。

1.1 定义Cluster schema

1.1.1. 创建子服务器

服务tab 选项

选项	描述
服务器名称	子服务器的名称
主机名称或IP地址	用作子服务器的机器的地址
端口号

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

liu_li_bin CSDN认证博客专家 CSDN认证企业博客

码龄15年

2: 原创

164万+: 周排名

90万+: 总排名

6398: 访问

: 等级

99: 积分

2: 粉丝

1: 获赞

0: 评论

4: 收藏

私信

关注

热门文章

分类专栏

BI 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。