参考
https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark
https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started
说明
每次运行HiveQL的时候都会有这么一条警告【WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive 1.X releases.】说明Hive-on-mr在Hive2中是不被推荐的,并且在将来的版本中可能不可用,那我们就考虑使用Tez来代替MR。接下来看一下版本兼容问题,我使用hive2.3.4和spark2.0.0
Spark安装
注意Spark中是绝对不能包含Hive jars的,所以需要重新编译Spark源码
spark源码包准备【spark-2.0.0.tgz】
略
在spark2.0.0之后我们使用以下命令来编译
./dev/make-distribution.sh --name "hadoop2-without-hive" --tgz "-Pyarn,hadoop-provided,hadoop-2.7,parquet-provided"
以下是spark2.0.0编译成功后的截图