Kettle使用入门笔记

Etl 介绍

ETL(Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于金融 IT 来说,经常会遇到大数据量的处理,转换,迁移,所以了解并掌握一种
etl 工具的使用,必不可少。Kettle 是一款国外开源的 etl 工具,纯 java 编写,绿色无需安装,数据抽取高效稳定。Kettle 中有两种脚本文件,transformation 和 job,transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。

kettle 部署运行

1.将 kettle4.3.1 文件夹拷贝到本地路径,例如 D 盘根目录。双击运行 kettle 文件夹下的 spoon.bat 文件
2.进入程序主页面后,选择没有资源库,打开 kettle 主界面建 创建 transformation ,job
在这里插入图片描述

3.点击页面左上角的 创建一个新的 transformation,点击 保存到本地路径,例如保存到 D:/etltest 下,保存文件名为 EtltestTrans,kettle 默认 transformation
文件保存后后缀名为 ktr点击页面左上角的 创建一个新的 job,点击 保存到本地路径,例如保存到 D:/etltest 下,保存文件名为 EtltestJob,kettle 默认 job 文件保存后后缀名为kjb

4.创建数据库连接

在 transformation 页面下,点击左边的【Main Tree】,双击【DB 连接】,进行数据库连接配置。

  • Connection name 自命名连接名称
  • Connection type 选择需要连接的数据库
  • Method of access 选择连接类型
  • Server host name 写入数据库服务器的 ip 地址
  • Database name 写入数据库名
  • Port number 写入端口号
  • Username 写入用户名
  • Password 写入密码
    例如如下配置:
    点击【test】,如果出现如下提示则说明配置成功
    点击关闭,再点击确定保存数据库连接。
    在这里插入图片描述

第一个转换(transformation)

  • 目标:
    两个结构相同的表数据同步更新
  • 操作步骤:
  1. 在核心对象中搜索表输出在这里插入图片描述,找到并拖动的主窗口。

  2. 在核心对象中搜索插入/更新在这里插入图片描述,拖动到主窗口。

  3. 连线。
    在这里插入图片描述

  4. 数据库连接选择刚刚创建好的 local数据库连接,在主窗口写入对应的查询
    语句,如select * from xxx_tb.
    在这里插入图片描述
    5.配置更新设置,包括数据库连接,目标表,查询关键字和更新字段。
    在这里插入图片描述

6.保存。

在这里插入图片描述
7.执行。
在这里插入图片描述
8.查看执行结果。

在这里插入图片描述
如果出现错误,可根据日志查明原因。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

NewTech精选

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值