hive on spark

最新推荐文章于 2024-09-06 18:01:42 发布

localhostAND

最新推荐文章于 2024-09-06 18:01:42 发布

阅读量533

点赞数

分类专栏：大数据文章标签： spark hive hadoop

本文链接：https://blog.csdn.net/blocalhost/article/details/127428815

版权

大数据专栏收录该内容

4 篇文章 0 订阅

订阅专栏

HDFS创建以下路径，用于存储相关jar包

hadoop fs -mkdir /Spark/spark-jars

解压缩spark-3.0.0-bin-without-hadoop.tgz并上传到上面目录,

tar -zxvf /opt/software/spark-3.0.0-bin-without-hadoop.tg
hadoop fs -put spark-3.0.0-bin-without-hadoop/jars/* /Spark/spark-jars

修改hive-site.xml,增加如下内容

 <!--Spark依赖位置 -->
 <property>
   <name>spark.yarn.jars</name>
   <value>hdfs://hadoop102:8020/Spark/spark-jars/*</value>
 </property>
<!--Hive执行引擎-->
 <property>
   <name>hive.execution.engine</name>
   <value>spark</value>
 </property>
 <!--Hive连接Spark超时时间-->
 <property>
   <name>hive.spark.client.connect.timeout</name>
   <value>10000ms</value>
 </property>

 <property>
   <name>spark.master</name>
   <value>yarn</value>
 </property>
 <property>
   <name>spark.home</name>
   <value>/opt/module/spark</value>
 </property>
 <property>
   <name>spark.eventLog.enabled</name>
   <value>true</value>
 </property>
 <property>
   <name>spark.eventLog.dir</name>
   <value>hdfs://hadoop102:8020/Spark/spark-eventLog</value>
 </property>
 <property>
   <name>spark.executor.memory</name>
   <value>1g</value>
 </property>
 <property>
   <name>spark.serializer</name>
   <value>org.apache.spark.serializer.KryoSerializer</value>
 </property>
 <property>
    <name>spark.executor.instances</name>
    <value>4</value>
 </property>
 <property>
    <name>spark.executor.cores</name>
    <value>4</value>
 </property>

4.出现这样的页面即算配置成功