spark3.5.1与HDP平台集成

本文讲述了在使用Spark3.5.1和HDP3.1.4环境中,如何实现实时消费Kafka数据并将其保存到Hive的问题,主要挑战在于依赖冲突,特别是与standalone-metastore-1.21.2.3.1.4.0-315-hive3.jar的兼容性。通过正确的配置和确保yarn节点目录结构,作者提供了解决方案。
摘要由CSDN通过智能技术生成

背景

业务开发要求能实现使用spark structured streaming实时消费kafka数据,处理结束能保存到hive中。要求使用最新的spark版本。

环境

hdp: 3.1.4
spark: 3.5.1

集成

问题

遇到的最大的问题是依赖冲突,各种状况的依赖冲突,一直把思路困在解决冲突上。

原因

核心是standalone-metastore-1.21.2.3.1.4.0-315-hive3.jar这个包,只要这个包配置正确,不会遇到其他问题。
Markdown将文本转换为 HTML。

spark.sql.hive.metastore.version 3.0
spark.sql.hive.metastore.jars /usr/hdp/current/spark2-client/standalone-metastore/standalone-metastore-1.21.2.3.1.4.0-315-hive3.jar

步骤

下载

正常下载包即可

配置

将hdp原来的spark2配置文件拷贝过来即可,包括spark-defaults.conf和hive-site.xml文件拷贝到spark的conf文件夹下。

重点

yarn执行节点所有目录必须包含 /usr/hdp/current/spark2-client/standalone-metastore/standalone-metastore-1.21.2.3.1.4.0-315-hive3.jar

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值