一、版本
1、hive-1.1.0-cdh5.14.2.tar.gz
2、hadoop-2.6.0-cdh5.14.2.tar.gz
3、pdi-ce-8.2.0.0-342.zip
注:我用的是cdh版本,如果和我同版本的hadoop一定要用这个版本的Kettle,你真的信我试了五个kettle版本,亲测有效,试的都快哭了。
二、kettle安装
解压就可,但是前提是已经安装了JDK。
三、添加驱动
E:\Software\Kettle\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh514
记住这个目录,你连接的驱动就放在这里面。
驱动的位置就在你linux的lib里面:/opt/soft/hive110/lib
把你所有的hive开头的jar包都移过去。
这只是第一步。
第二步是hadoop的驱动。
这个很重要,对后面的hadoop操作很重要。
四、配置文件
安装包中已经自带了配置文件
但是你需要将自己hadoop生态圈的配置文件更新过来。
五、设置active
active.hadoop.configuration=cdh514
这是最重要的,指定你的驱动指向版本。