(idea)将mapreduce程序打成jar包到集群上运行

  1. 将mapreduce程序打成jar包,步骤如下图所示:
    在这里插入图片描述

  2. 将jar包拖入linux虚拟机
    在这里插入图片描述

  3. 在虚拟机上启动集群

  4. 在hdfs文件系统上创建输入文件的目录
    在这里插入图片描述

  5. 上传输入文件到目录中,上传后查看文件是否在该目录下存在
    在这里插入图片描述

  6. 运行jar包
    (1)注意在运行这条命令前,output 这个目录有可能是不应该存在的(根据自己代码的情况来确定应不应该存在),否则Hadoop会报错并拒绝运行作业。运行完后会自动生成output文件夹,并且output文件夹中有运行后的结果。
    (2)output目录可以存在的情况是你的程序对此目录是否存在做了判断。
    下图是mapreduce程序中main函数设置job的输入原文件所在的目录,如果你用了图中被注释掉的两行设置目录,则需要每次在集群上执行jar前将output目录删除;但输如果是非注释部分设置目录,则不需删除该目录。

在这里插入图片描述
7. 查看运行结果
在这里插入图片描述

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值