1.版本信息
Kettle(PDI):7.1
Hadop:2.7.3
HBase:1.2.6.1
2.Hadoop Cluster配置
a.拷贝你的集群中的 core-site.xml、hbase-site.xml到
Kettle安装目录下plugins/pentaho-big-data-plugin/hadoop-configurations/hdp25/中
b.如下图,右击Hadoop Clusters,点击New Cluster
c.集群选择HortonWorks HDP 2.5.x,或者修改
Kettle安装目录下plugins/pentaho-big-data-plugin/plugin.properties配置文件的active.hadoop.configuration=hdp25
d.如下图,填写图中两项即可
e.点击Test,确认如下图即可,其他红X不用管
3.HBase Output具体操作步骤
参考https://wiki.pentaho.com/display/BAD/Loading+Data+into+HBase即可,很详细,比网上搜到的好得多,只是对Hadoop Cluster配置讲的不是很清晰,可参考上面的"2.Hadoop Cluster配置"。
4.填坑
如上图,点击Get table names后,需再到左侧下拉框中选择table,我之前一直以为会弹出对话框让我选择表,结果一直不弹,导致我以为没连上HBase。感觉这个地方不太人性化,至少点击后在左侧下拉框中默认选择一张表...