hadoop集群运行模式需要注意的几点

以上文单词计数为例,要将上文的本地运行模式改为集群运行模式,只需要如下三步:

(1)第一步:将程序更改输入和输出的路径

(2)第二步:打jar包 将jar包上传到任意一台的linux上面去

(3)第三步:运行jar包  yarn  jar  xxxx.jar   类完全路径 input路径 output路径

第一步:将程序更改输入和输出的路径

将run方法中的本地运行模式的代码改为如下:

 //集群模式(输入路径)
    //TextInputFormat.addInputPath(job,new Path("file:///hdfs:8020/wordCount/input"));
    TextInputFormat.addInputPath(job,new Path(args[0]));
//集群模式
   //  TextOutputFormat.setOutputPath(job,new Path("file:///hdfs:8020/wordCount/output"));
    TextOutputFormat.setOutputPath(job,new Path(args[1]));

如果按照第一种地址,可能在输入命令后报如下异常:java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: hdfs:8020。

第二步:打jar包并上传到linux

(1)下载core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml文件到本地磁盘,再将这四个文件粘贴到项目下的resource文件夹下。

(2)打包,idea右侧maven,Lifecycle中,先双击clean,再选中Test取消,最后再双击package;等打包成功后,可以看到左侧项目栏,target下面多了一项xxx.jar包的文件;

(3)将该jar包上传至linux系统;

第三步:运行jar包,输入命令yarn  jar  xxxx.jar 类路径 集群input路径 集群output路径

 

 

 

 

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值