Kettle工具的安装和部署、入门

kettle介绍

kettle是一个开源的ETL工具,纯java代码编写,可以在Windows、linux、unix系统上运行
绿色无需安装,高效的完成数据抽取转换加载。
1、kettle存储方式
  xml形式存储
  以资源库方式存储(数据库资源库、文件资源库)
2、kettle设计
  转换:tranform,完全针对数据的基础进行转换
  作业:job:整个工作流的控制
区别:
  作业是步骤流,转换是数据流,这就是job和tranform最大的区别
  作业的每个步骤,必须等到前面的步骤执行完毕,后面的步骤才会执行,而转换会一次性把所有
控件先启动(一个控件对应一个线程)
3、kettle组成
  3.1 spoon.bat/spoon.sh 勺子:一个图形化界面,可以让我们用图形化的方式开发tranform和job
  3.2 pan.abt/pan.sh 煎锅: 利用pan来调用tranform
  3.3 kitchen.bat/kitchen.sh 厨房: 利用kitchen命令来调用job
  3.4 Carte.bat/Carte.sh : 菜单: 轻量级的web服务器,用于建立远程的ETL服务器

kettle安装部署

1、现在网上下载好安装包

官网地址:https://community.hitachivantara.com/s/article/data-integration-kettle

 2、直接解压,运行Spoon.bat就可以启动了

    在此之前 需要配置jdk环境变量

 到此kettle工具就安装好了

入门案例 - kettle实现单表数据迁移

1、连接数据库驱动

在运行之前,我们需要下载对应数据库的jar包导入到Kettle的lib目录下,比如我们需要把oracle迁移到mysql,

那就需要oracle和mysql两个jar包, 我用的是这里两个:

 2、配置kettle转换

双击打开spoon.bat,在左侧主对象菜单栏,新建一个转换,命名为abcd,如下图:

 3、配置oracle和mysql连接

在DB连接一栏,右击新建连接,配置数据库连接

注意主机名称尽量不要填localhost

  点击测试,显示成功即为配置完成

 4、配置迁移步骤

在左侧菜单栏【转换】里面,选择【核心对象】,选中输入下将【表输入】拖拽到右侧空白区域。

双击你拖进来的表输入,修改“步骤名称”,选择源数据,点击获取【获取SQL查询语句】,选择你想同步的表,

点击确定后就可以了。当然也可以自己写sql语句,点击获取SQL查询语句 选择一张你要迁移的表数据

 

 点击预览可以查看要迁移的数据。

接下来配置表输出,在左侧菜单栏【转换】里面,选择【核心对象】,选中将【表输出】拖拽到右侧空白区域。

双击表输出,配置要迁移的目标表,我这里两边数据库字段一样,故而可以不用修改,如图:

 接下来配置字段选择,在左侧菜单栏【转换】里面,选择【核心对象】,选中将【字段选择】拖拽到右侧空白区域。

双击字段选择,选择列映射,匹配源字段和目标字段是否一致,不一致的原因可能是字段类型不一。

 点击Add,然后点击确定

 ctrl+s保存文件,到这里一个简单的转换就配置完成了。

5、开始迁移数据

手动运行,点击下图圈圈里面的按钮

 

 点击启动,日志级别这里可以选择错误日志,这样只记录错误信息

 转换输出栏如下图:

 

  最后检测两边表,如记录数count(*)、表中数据对比等没问题的话表示转换完成。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle(又称为Pentaho Data Integration)是一种开源的ETL(Extract, Transform, Load)工具,用于数据集成和处理。以下是Kettle安装部署步骤: 1. 下载Kettle:你可以从官方网站(https://sourceforge.net/projects/pentaho/files/Data%20Integration/)下载最新版本的Kettle。 2. 安装Java:确保你的计算机上已安装Java Development Kit(JDK)。Kettle需要Java环境才能运行。 3. 解压Kettle:将下载的Kettle压缩包解压到你选择的目录中。 4. 配置环境变量:打开终端或命令提示符,将Kettle安装路径添加到系统的PATH环境变量中。这样你就可以在任何位置运行Kettle。 5. 启动Kettle:进入Kettle安装目录,在终端或命令提示符中运行`spoon.bat`(Windows)或`spoon.sh`(Linux/Unix)来启动Kettle的图形用户界面。 6. 连接数据库:在Kettle中,你需要配置数据库连接以便进行数据集成和处理。在图形用户界面中,点击"Edit"菜单下的"Database Connections"选项,设置数据库连接信息。 7. 创建转换和作业:使用Kettle的图形用户界面,你可以创建数据转换(Transformation)和作业(Job),用于执行各种数据集成和处理任务。 8. 运行转换和作业:在Kettle中,你可以通过点击"运行"按钮来执行转换和作业。你还可以使用Kettle的调度功能,定期自动运行转换和作业。 请注意,以上步骤仅提供了Kettle的基本安装部署过程。实际部署可能因你的操作系统和需求而有所不同。建议参考Kettle的官方文档和社区资源,以获取更详细的安装部署指南。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值