hadoop shell执行示例wordcount jar包

创建用户目录

bin/hdfs dfs -mkdir -p /user/hadoop

 

创建input目录

bin/hdfs dfs -mkdir input

 

导入数据

bin/hdfs dfs -put etc/hadoop/*.xml input

 

Hadoop运行程序时,默认输出目录不能存在,删除output文件夹

bin/hdfs dfs -rm -r /user/hadoop/output     

 

执行jar包

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

 

(1)bin/hadoop:${HADOOP_HOME}/bin下的shell脚本名。

(2) jar:hadoop脚本需要的command参数。

(3) share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar:要执行的jar包在本地文件系统中的完整路径,参递给RunJar类。

(4) grep:main方法所在的类,参递给RunJar类。

(5) input:传递给WordCount类,作为DFS文件系统的路径,指示输入数据来源。

(6)output :传递给WordCount类,作为DFS文件系统的路径,指示输出数据路径。

 

 

查看hdfs中的输出结果

bin/hdfs dfs -cat output/*

 

将输出结果导到本地

rm -R ./output

bin/hdfs dfs -get output output     # 将 HDFS 上的 output 文件夹拷贝到本机

cat ./output/*

 

 

在程序中输出前删除输出目录代码

onfiguration conf = new Configuration();

Job job = new Job(conf);

...

/* 删除输出目录 */

Path outputPath = new Path(args[1]);

outputPath.getFileSystem(conf).delete(outputPath, true);

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值