Hive on Spark on Yarn

本文详细介绍了如何在Hive 2.3.4和Spark 2.0.0环境下,将Hive的执行引擎切换为Spark,并在Yarn上配置和运行。内容包括Spark的重新编译、Yarn的公平调度器配置、Hive的配置更改、Spark配置调整以及启动过程中的错误排查和解决方法。最终成功实现了Hive on Spark on Yarn的运行。
摘要由CSDN通过智能技术生成

参考

https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark

https://cwiki.apache.org/confluence/display/Hive/Hive+on+Spark%3A+Getting+Started

https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties#ConfigurationProperties-Spark

 

说明

每次运行HiveQL的时候都会有这么一条警告【WARNING: Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions. Consider using a different execution engine (i.e. spark, tez) or using Hive 1.X releases.】说明Hive-on-mr在Hive2中是不被推荐的,并且在将来的版本中可能不可用,那我们就考虑使用Tez来代替MR。接下来看一下版本兼容问题,我使用hive2.3.4和spark2.0.0

 

Spark安装

注意Spark中是绝对不能包含Hive jars的,所以需要重新编译Spark源码

spark源码包准备【spark-2.0.0.tgz】

在spark2.0.0之后我们使用以下命令来编译

./dev/make-distribution.sh --name "hadoop2-without-hive" --tgz "-Pyarn,hadoop-provided,hadoop-2.7,parquet-provided"

以下是spark2.0.0编译成功后的截图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值