一直想利用kettle工具实现直接连接hive和mysql操作数据,在踩过很多坑后终于实现,故记录分享。
软件环境:
Hadoop-2.7.1(单机)、apache-hive-2.3.5-bin、MySQL-5.6.1、pdi-ce-7.1.0.0-12(kettle)
一、首先需要配置hiveserver2并开启hive2客户端,kettle才能连接到hive。
①、配置hive-site.xml文件,在hive-site.xml中添加一下内容
hive.cli.print.header true hive.server2.thrift.port 10000 hive.server2.thrift.bind.host 192.168.133.135②、启动Hadoop,通过jps查看进程
③、开启hiveserver2,输入命令hiveserver2 或者 hive --service hiveserver2(开启hive的命令是:hive)
hiveserver2 或者 hive --service hiveserver2
如果出现以下xshell内容,别慌张,正常现象,因为启动了一个服务
jps查看进程,发现多了RunJar,即为hiveserver2服务