Hadoop如何加载第三方包

本地IDE中编写的Hadoop程序在集群运行时出现NoClassDefFoundError,原因是缺少nl.bitwalker.useragentutils.UserAgent包。通过将该包上传到Linux并设置HADOOP_CLASSPATH环境变量,成功解决运行时找不到类的问题。此方法适用于处理Hadoop不支持的第三方依赖。
摘要由CSDN通过智能技术生成

报错背景:

本地idea编写Hadoop程序,对nginx日志进行分析,引入nl.bitwalker.useragentutils.UserAgent包解析nginx的浏览器信息获取浏览器系统名称和浏览器名称,

本地测试可以完全ok,然后打包到Hadoop集群运行,报错找不到nl.bitwalker.useragentutils.UserAgent包

java.lang.Exception: java.lang.NoClassDefFoundError: nl/bitwalker/useragentutils/UserAgent
	at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:492)
	at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:552)
Caused by: java.lang.NoClassDefFoundError: nl/bitwalker/useragentutils/UserAgent
	at cn.awz.log.LogMapper.getOperatingSystem(LogMapper.java:84)
	at cn.awz.log.LogMapper.getBrowser(LogMapper.java:93)
	at cn.awz.log.LogMapper.parse(LogMapper.java:49)
	at cn.awz.log.LogMapper.map(LogMapper.java:25)
	at cn.awz.log.LogMapper.map(LogMapper.java:16)
	at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:146)
	at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:799)
	at org.apache.hadoop.mapred.MapTask.run(MapTask.java:347)
	at org.apache.hadoop.mapred.LocalJobRunner$Job$MapTaskRunnable.run(LocalJobRunner.java:271)
	at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
	at java.util.concurrent.FutureTask.run(FutureTask.java:266)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
	at java.lang.Thread.run(Thread.java:748)
Caused by: java.lang.ClassNotFoundException: nl.bitwalker.useragentutils.UserAgent
	at java.net.URLClassLoader.findClass(URLClassLoader.java:382)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
	... 14 more
原因Hadoop默认不支持第三方包,

查了好多文档和博客依然没解决,无意间看见一篇博客(后来找不到啦)叫我在环境变量里面配置
HADOOP_CLASSPATH完美解决

解决在maven仓库中找到该包,

在这里插入图片描述

上传到主节点所在的Linux中,配置环境变量,

export HADOOP_CLASSPATH=~/UserAgentUtils-1.2.4.jar

激活环境变量

source /etc/profile

运行架包

hadoop jar code-1.0-SNAPSHOT.jar cn/awz/log/LogDriver /flume/upload/20220317/17 /nginxLogs

在这里插入图片描述
成功

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

炸鸡叔老白

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值