前一段时间使用kettle的时候需要连接Hive和Hbase,在网上搜的一些配置在都是kettle5或者6的,和kettle7不通用。所以自己搞了一个下午搞了出来,打个笔记记录一下。
1,将需要的jar包放到kettle的D:\pdi-ce-7.1.0.0-12\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations目录下。我这里是D盘。
2,在host文件下配置集群的ip映射。
3,配置hbase-site.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<!--Autogenerated by Cloudera Manager-->
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://bzdt01:8020/hbase</value> --- 这里bzdt01是你集群的主节点的名称也是你host文件中配置的映射
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>bzdt01</value> ---bzdt01是你zookeeper的主节点名称
</property>
<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2181</value> ----2181是zookeeper配置的端口号
</property>
</configuration>
4,kettle中配置集群地址
5,hbase连接设置
6,hive连接配置