一、运行环境
CentOS 7.2
Hadoop 2.7
Hive 2.2.0
Spark 2.0.0
JDK 1.7
Scala 2.11.8
Maven 3.3.9
说明:Scala 2.11.8以后的版本只支持JDK1.8,如果环境原本是使用JDK1.7的就不需要安装最新版本。
二、开始配置前的排坑
很多人都会参考Hive on spark的官方手册https://cwiki.apache.org//confluence/display/Hive/Hive+on+Spark:+Getting+Started来配置,但其中还是有很多坑的,下面就说一下官方手册上的坑及没有提到一些细节。
1)版本兼容问题
HIVE官方指引说Spark一定要安装没有HIVE jar包的版本。原文“Note that you must have a