kettle 表输入 显示重复_【Kettle】Kettle入门解析(二) - Main丶H

fab3d05b4e516ee81c9899a076a15844.png5393f3c2cad443aea04c3c11ffb2e1e3.png0845c3a091ac367c0c8885cadb16edff.png80f75a6170c0dff5e419bba26e0ba05c.png

(图片来源于网络,侵删)


Kettle实战1(将Hive表的数据输出到Hdfs)

【1】环境准备

1)进入Kettle的plugins\pentaho-big-data-plugin目录,编辑文件

根据自己的hadoop版本添加不同的类型,我的是cdh的,所以添加cdh51492a14c5aa6e1dc71a367b051549783e8.png
有哪些版本可以在该目录下查看plugins\pentaho-big-data-plugin\hadoop-configurations

2)修改完成后进入自己对应的版本,我的是cdh514,所以进入plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514目录

将集群的Hadoop、Hive配置复制到该目录中
分别是hive-site.xml

3)然后启动Kettle!!!

注意: 如果在连接Hive的时候报错Error connecting to database: (using class org.apache.hive.jdbc.HiveDriver) Illegal Hadoop Version: Unknown (expected A.B.* format),就将自己hadoop对应版本的(我的是)放到根目录的 lib目录下,然后重启Kettle即可!

【2】在Hive中创建库表

前提:开启HDFS、Yarn、HiveMetaStore、HiveServer2
1)创建Kettle库
create database kettle;
use kettle;
2)创建Emp、Dept表
CREATE TABLE dept(deptno int, dname string,loc string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; 
CREATE TABLE emp(
empno int,
ename string,
job string, mgr int, hiredate string, sal double, comm int, deptno int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; 
3)插入数据
insert into dept values
(10,'accounting','NEW YORK'), (20,'RESEARCH','DALLAS'), (30,'SALES','CHICAGO'), (40,'OPERATIONS','BOSTON'); 
insert into emp values
(7369,'SMITH','CLERK',7902,'1980-12-17',800,NULL,20), (7499,'ALLEN','SALESMAN',7698,'1980-12-17',1600,300,30), (7521,'WARD','SALESMAN',7698,'1980-12-17',1250,500,30), (7566,'JONES','MANAGER',7839,'1980-12-17',2975,NULL,20); 
4)Kettle实战

注意,虽然这里报了错,但是HDFS上已经生成了该文件,需要把HDFS上的空文件删除

重新执行之后结果如下?

de15308e277a4c2f9b1e3320af6c7c23.png


Kettle实战2(将Json数据选取指定列输出到Hdfs)

查看结果?

5594ce61ba982238c22a8f283481531c.png


都看到这里了,点赞评论一下吧!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值