kettle清洗mysql数据_ETL工具Kettle使用以及与Java整合实现数据清洗

本文详述了如何使用ETL工具Kettle进行数据清洗,特别是与MySQL数据库的交互。通过新建转换,设置表输入和表输出节点,配置数据库连接,以及处理编码问题,展示了Kettle在数据提取和加载过程中的应用。此外,还介绍了如何在转换中使用自定义参数,并在启动时为参数赋值。最后,讨论了资源库的创建和登录,以便在数据库中保存和管理转换脚本。
摘要由CSDN通过智能技术生成

本文主要讲述kettle的使用和与Java整合,具体下载与安装请自行百度!

kettle有两种脚本方式:转换和工作,工作中可以添加转换.以下以转换为例.

39c8a9dfcdc43a54487c980856a5ce75.png

1.新建一个转换,

6c05f2f0ddad3d0900bd94997f7f8db8.png

2.在工作中经常用到的是表输入和表输出(从一个数据库中提炼数据,插入到另外一个数据库中进行保存)

点击核心对象 --> 输入 --> 表输入

959f1056c363c0a6262b2f47fe114a0c.png

a5a039499366f0f6d023dbff017ca8ec.png

这个节点是用来从数据库中查询数据

点击“表输入”-->新建 首先创建一个数据库连接,要让kettle知道从哪里查询数据

a5fa909239b1fcc17a1730f638afa6cd.png

kettle支持多种数据库连接,因为工作中用到的是mysql,所以其余的可以自行百度了解

979b43fef4ac147f90b6732d14dfa6e4.png

因为在使用过程中,可能数据库编码方式不一致,所以需要制定编码,在创建数据连接的时候,点击高级选项卡,如图所示(set names utf8;)

2899b566adc981bd3cfdfc848734cf1f.png

在点击选项选项卡,如图所示:characterEncoding:utf8

542e48ce3047826b24d40b4a90a070c2.png

创建完成后,点击保存,下面就是开始写sql,kettle支持sql中油自定义参数的形式,参数要使用${}来进行创建。注意一点,要勾选下面的,替换sql语句里的变量。

15bb6843d8d02ef5085503e460155ab5.png

创建好后点击确定。

在创建一个节点,用来接收数据,点击输出中的表输出,创建数据库连接,和上面创建步骤一样

fa1d685dd37dfeca3522705dd2b2ba12.png

点击输入字段映射,可自动生成对应字段。

3.创建完成后,使用shift和鼠标左键将两个节点连接在一起

a40d8eb93d6c4d6eb9b9970373148d2f.png

4.启动:

如果在查询时自定义了参数,那么在启动时需要个参数赋值:

7941a1baef4bb3fc770d2ba10ec4d480.png

5.还需注意一点,如果没有创建资源库,那么创建的转换/作业是要保存成脚本存放到本地,但是,如果已创建了资源库,那么脚本会错放到数据库中,不会生成文件!

6.资源库的创建

f9d3c3cba9b4e6f9cb32173483cfe6e9.png

第一次需要新建资源库,如果已经创建,选择对应的资源库然后输入账号密码即可(账号密码默认admin)

ffc3dbc979fc32fabca3dd017bcf8e9d.png

在创建资源库时,点击+号,然后会出现图中的样式,我们选择第二个,会将数据生成到数据库中进行保存。

7cc3158468533a883d844864441d2fcc.png

我们需要指定资源库存放的数据库连接是哪个,创建方式和上面我们创建节点的数据库连接一样,创建完后,选择数据库连接,名称和描述自己取名即可(尽量不要重复,与Java整合时需要这两个参数)

创建完成后,我们输入账号密码即可登录到资源库中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值