spark引用jar包_spark应用程序引用别的jar包

共同努力学习学习

于 2020-12-28 23:26:39 发布

阅读量547

点赞数

文章标签： spark引用jar包

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_28267011/article/details/111989325

版权

本文详细介绍了在Spark应用程序中引用外部jar包的四种常见方式：1) 将jar包打包进应用程序jar；2) 使用`--jars`参数指定本地jar路径；3) 利用`--packages`参数引入Maven仓库的jar包；4) 修改SPARK_CLASSPATH环境变量添加jar路径。每种方法都有其适用场景和注意事项，如本地jar文件的存在、集群间jar文件的同步等。

摘要由CSDN通过智能技术生成

第一种方式

操作：将第三方jar文件打包到最终形成的spark应用程序jar文件中

应用场景：第三方jar文件比较小，应用的地方比较少

第二种方式

操作：使用spark-submit提交命令的参数: --jars

要求：

1、使用spark-submit命令的机器上存在对应的jar文件

2、至于集群中其他机器上的服务需要该jar文件的时候，通过driver提供的一个http接口来获取该jar文件的(例如：http://192.168.187.146:50206/jars/mysql-connector-java-5.1.27-bin.jar Added By User)

应用场景：要求本地必须要有对应的jar文件

第三种方式

操作：使用spark-submit提交命令的参数: --packages

## 配置参数：--packages jar包的maven地址

如下示例：

$ bin/spark-shell --packages mysql:mysql-connector-java:5.1.27 --repositories http://maven.aliyun.com/nexus/content/groups/public/

## --repositories 为mysql-connector-java包的maven地址，若不给定，则会使用该机器安装的maven默认源中下载

## 若依赖多个包，则重复上述jar包写法，中间以逗号分隔

## 默认下载的包位于当前用户根目录下的.ivy/jars文件夹中

应用场景：本地可以没有，集群中服务需要该包的的时候，都是从给定的maven地址，直接下载

第四种方式

操作：更改Spark的配置信息:SPARK_CLASSPATH, 将第三方的jar文件添加到SPARK_CLASSPATH环境变量中

注意事项：要求Spark应用运行的所有机器上必须存在被添加的第三方jar文件

A.创建一个保存第三方jar文件的文件夹:

命令：$ mkdir external_jars

B.修改Spark配置信息

命令：$ vim conf/spark-env.sh

修改内容：SPARK_CLASSPATH=$SPARK_CLASSPATH:/opt/cdh-5.3.6/spark/external_jars/*

C.将依赖的jar文件copy到新建的文件夹中

命令：$ cp /opt/cdh-5.3.6/hive/lib/mysql-connector-java-5.1.27-bin.jar ./external_jars/

应用场景：依赖的jar包特别多，写命令方式比较繁琐，被依赖包应用的场景也多的情况下

或者在spark-default.conf下面，配置

spark.executor.extraClassPath=/data/*spark.driver.extraClassPath=/data/*

备注：(只针对spark on yarn(cluster)模式)

spark on yarn(cluster)，如果应用依赖第三方jar文件

最终解决方案：将第三方的jar文件copy到${HADOOP_HOME}/share/hadoop/common/lib文件夹中(Hadoop集群中所有机器均要求copy)

共同努力学习学习

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。