前言
上一篇文章讲到Kettle的安装部署,假设JDK已装好,Kettle的spoon可以正常打开。本文我们选取SQL Server作为数据源,来探讨怎样使用Kettle。
Kettle主要包含两大部分,下面用案例来讲怎样创建转换transform和作业job。
1.转换transform:完全针对数据的基础进行转换
2.作业job:整个工作流的控制
数据准备:
--建数据库CXJ_kettle
drop database CXJ_kettle if exist;
create database CXJ_kettle if not exist;
use CXJ_kettle
--建表stu1
drop table stu1;
create table stu1(
id int ,
name varchar(20),
age int
);
--建表stu2
drop table stu2;
create table stu2(
id int,
name varchar(20)
);
--插入数据
insert into stu1 values(1001,'Ding',20),(1002,'Bella',21),(1003,'Icey',22);
insert into stu2 values(1001,'Icey');
--查询表数据
select * from stu1;
select * from stu2;
SSMS查询结果:
stu1:
stu2:
案例
需求背景:把表stu1的数据按照id同步到stu2,stu2有相同的id则更新数据。
1.1 连接数据源
准备数据库驱动包
由于 kettle 需要连接数据库,因此需要下载对应的数据库驱动包。本文章连接的数据源是SQL Server,去网址jTDS - SQL Server and Sybase JDBC driver下载 jtds包,解压后,将文件夹下的 jar 文件“jtds-1.3.1”复制到kettle 解压后路径的 Kettle/data-integration/lib 文件夹中,重新启动kettle。
若Kettle连接MySQL 数据源,则需要下载 mysql-connector-java.jar,下载网址为: