hadoop3.1.3+hive3.1.2+spark2.4.5组成hive on spark

badcodeSSS

于 2021-09-17 21:11:25 发布

阅读量2.6k

点赞数

文章标签： spark hive big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35585375/article/details/120356745

版权

本文介绍了如何使用hadoop3.1.3、hive3.1.2和spark2.4.5搭建Hive on Spark环境。重点配置包括hive-site中设置hdfs中spark的jar依赖，以及spark-defaults中指定master、executor内存等参数。在过程中可能遇到的错误，如guava版本不兼容和缺少hive中spark相关jar，作者给出了详细的解决办法和相关jar的下载链接。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

hadoop 配置就不记录了，百度都有

hive就是用开源的3.1.2版本，官方默认是支持spark2.4.5的

hive-site注意配置hdfs中spark的jar依赖，这里要注意路径

这里的spark用的是自己编译的版本，依赖于hadoop3.1.3，并排除了hive依赖

spark-default 如下

spark.master yarn
spark.eventLog.enabled true
spark.eventLog.dir hdfs://hadoop01:8020/spark-history
spark.executor.memory 1g
spark.driver.memory 1g
spark.yarn.jars hdfs://hadoop01:8020/user/root/spark-jars/*

这里需要注意的点：

①资源最好分配大一点

②yarn.jars要注意端口号和jars的路径，这个路径是hdfs的路径，要到hdfs上做对照

③spark-history要提前创建好

spark-env 测试环境只做了简单配置确保可以运行，如果需要调整再添加即可

YA

最低0.47元/天解锁文章

博客等级

码龄9年

1
原创

0
点赞

13
收藏

1
粉丝

关注

私信

热门文章

hadoop3.1.3+hive3.1.2+spark2.4.5组成hive on spark 2687

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。