在cdh-hive0.10中建rcfile存储格式的表,发现hive启动了一个local hadoop来进行格式转换,也就是用一个单机版的mapreduce来做。奇慢无比。
解决办法如下:
进入hive cli之后,执行:
hive> SET mapred.job.tracker=impala11:8021
其中impala11:8021是hadoop jobtracker的主机名和端口。
这是在hive的运行时环境中设置的,退出hive客户端就失效了。
参考:https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-Runtimeconfiguration