hadoop分布式下打包运行时报java.lang.RuntimeException: java.lang.ClassNotFoundException的原因

通过打包运行MapReduce程序的时候,当程序中包含自定义的类时,job执行时会出现异常:java.lang.RuntimeException: java.lang.ClassNotFoundException,抛出异常的原因是由执行task的节点找不到自定义的类引起的,mapreduce程序在hadoop中的运行机理:mapreduce框架在运行Job时,为了使得各个从节点上能执行task任务(即map和reduce函数),会在作业提交时将运行作业所需的资源,包括作业jar文件、配置文件和计算所得的输入划分,复制到HDFS上一个以作业ID命名的目录中,并且作业jar的副本较多,以保证tasktracker运行task时可以访问副本,执行程序。

解决这个异常的关键就是要让task的节点找到自定义的类,我试了很多方法,都失败了,最后还是在官网上找到了DistributedCache类,幸好hadoop设计者早就考虑到了这个问题,用DistributedCache的addFileToClassPath()方法就可以解决那个异常。还有一点要注意DistributedCache.addFileToClassPath(new Path(""), Conf)里的Path必须是HDFS上的文件,所以需要把jar包也上传到HDFS上,要用”hdfs://master:9100/input/app.jar“这种方式获取文件,执行Job,就OK了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值