Kettle快速入门

0.资源下载

链接: https://pan.baidu.com/s/1EJGXy19x70081pl1MkxfDw 提取码: xn63 复制这段内容后打开百度网盘手机App,操作更方便哦

1.快速入门

将下载好的压缩包解压(注意:上级目录不能有中文

image-20210322193743691

将mysql-connector-java-5.1.38.jar复制到lib文件夹下面

image-20210322194517175

进入目录data-integration,双击Spoon.bat启动(第一次记载比较慢)

image-20210322193839678

启动成功,点击右上角connect

image-20210322194113940

新建配置仓库

image-20210322194153200

image-20210322194215343

注意:不能有中文

image-20210322194244201

新建

image-20210322194259285

配置文件(注意需要提前在mysql创建kettle数据库)

image-20210322194800203

链接成功

image-20210322194813246

之后点击finsh创建配置仓库完成。

默认使用admin admin登录仓库

image-20210322194929824

成功连接

image-20210322194949220

2.测试MySQL连接

在mysql创建kettledemo数据库,并创建表格

create table stu1(id int, name varchar(20), age int);
create table stu2(id int, name varchar(20));

insert into stu1 values(1001,'zhangsan',22),(1002,'lisi',22),(1003,'xiaohua',22);
insert into stu2 values(1001,'hanmeimei');

image-20210322195143830

创建转换

image-20210322195158125

拉取表输入并双击

image-20210322195321247

新建

image-20210322195359063

创建链接

image-20210322195446539

预览数据

image-20210322195543081

拉取插入更新

image-20210322200047853

按住shift连接

image-20210322200107515

如图进行配置

image-20210322200151758

执行

image-20210322200207542

执行成功

image-20210322200236231

image-20210322200252628

3.测试Hive连接

首先启动hiveserver2服务

image-20210322215743505

在hive的default数据库下创建表格数据

create table emp(
empno int,
ename string, 
job string,
mgr int,
hiredate string,
sal int,
comm string,
deptno int
)
row format delimited
fields terminated by '\t';

create table dept(
deptno int,
dname string, 
loc string
)
row format delimited
fields terminated by '\t';

insert into dept values
(10,'accounting','NEW YORK'),
(20,'RESEARCH','DALLAS'),
(30,'SALES','CHICAGO'),
(40,'OPERATIONS','BOSTON');

insert into emp values
(7369,'SMITH','CLERK','7902','1980-12-17',800,NULL,20),
(7499,'ALLEN','SALESMAN','7698','1980-12-17',1600,300,30),
(7521,'WARD','SALESMAN','7698','1980-12-17',1250,500,30),
(7566,'JONES','MANAGER','7839','1980-12-17',2975,NULL,20);

修改data-integration\plugins\pentaho-big-data-plugin目录下的plugin.properties

image-20210322220143912

进入data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp26文件夹,将服务器的配置文件拉取到本地

image-20210322220245241

我的hive版本是1.1.0而kettle里面的版本是1.2.0

image-20210322220420648

于是我将kettle的hive文件删除,然后复制了服务器的hive相关jar

image.png

创建表输入并配置hive连接

image-20210322221659987

加载表数据

image-20210322221724652

image-20210322221748138

进行排序

image-20210322222131736

image-20210322222156170

连接数据

image-20210322222559200

文件输出

image-20210322222624140

测试

image-20210322222652328

注意:

脚本执行语句

执行job

Kitchen.bat -rep=mysql_rep -user=admin -pass=admin -job=jobdemo1 -dir=/ -logfile=H:\study\kettle\kettle-neo4j-remix-8.2.0.7-719-REMIX\data-integration\logs\log.txt

 ./kitchen.sh -rep=mysql_rep -user=admin -pass=admin -job=jobdemo1 -dir=/ -logfile=./logs/log.txt

执行转换

./pan.sh -rep=mysql_rep -user=admin -pass=admin -trans=hive2hdfs -dir=/
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值