MapReduce程序调用第三方Jar包的方式

最新推荐文章于 2021-11-10 00:29:34 发布

JohnLee310

最新推荐文章于 2021-11-10 00:29:34 发布

阅读量6.1k

点赞数 2

分类专栏： Hadoop 大数据文章标签： hadoop libjars

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lizhang310/article/details/24399403

版权

本文介绍了在MapReduce程序中如何调用第三方Jar包的三种方式，重点讲解了通过libjars参数的方法，避免了将所有依赖打包到一起导致的jar包过大问题。通过在集群节点上传jar包，修改MapReduce运行方式，并编写脚本设置HADOOP_CLASSPATH和LIBJARS，实现了方便地使用第三方库。

摘要由CSDN通过智能技术生成

编写MapReduce程序时经常会用到第三方的jar包，主要有一下三种方式：

1、将第三方jar包copy至$HADOOP_HOME/lib目录里；

2、将第三方jar包和你的MapReduce程序打成一个jar包；

3、使用 libjars 这个参数。

第一种方式貌似需要重启Hadoop集群，才能生效，岂不是每次新增jar包就得重启集群，不靠谱。之前一直使用第二种方式，使用eclipse将第三方jar包和自己的代码封装到一个jar包里，但是随着第三方的jar文件越来越多，jar包也越来越大，现在已经60MB了，上传集群太麻烦了，放弃。最终，使用的是第三种方式，感觉非常方便，使用方式记录如下：

1、在集群某个节点上传所需第三方jar包（我上传到了NameNode上，因为运行MapReduce我是在namenode上），新建了一个目录/root/libjars来保存这些jar包。

2、修改MapReduce中获取配置的方式，使用getConf这个函数，和ToolRunner.run的方式来运行job，代码如下：

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。