hadoop集群自带WordCount例子

默认当前位置是hadoop安装包位置

 

jar包:share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.0.jar

一 前置准备

$ cd share/hadoop/mapreduce/

因为这个需要hdfs中的文件,需要掌握基本的hdfs命令 

HDFS基本的文件命令:
    格式: hadoop fs -cmd <args>
    其中,cmd代表具体的文件命令,与unix对应的命令相同,args表示可变的参数。
如,
    hadoop fs    ——获取完整的可用命令列表
    hadoop fs -ls /  ——返回根目录下/user的信息
    hadoop fs -lsr / ——返回根目录下所有文件和子目录
    hadoop fs -put example.txt . ——把本地文件复制到HDFS的默认目录中
    hadoop fs -put example.txt /user/hadoop
    hadoop fs -get example.txt . ——把HDFS中的文件复制到本地
    hadoop fs -cat                      ——在命令行中显示文件内容
    hadoop fs -rm                      ——删除文件
    hadoop fs -rmr                     ——删除目录

hdfs当前默认位置是在user/当前用户 文件夹 ,有些版本可能没有初始化这个文件夹 需要自己创建

$hadoop fs -mkdir /uesr
$hadoop fs -mkdir /uesr/xingluou

本地创建一个文本test用来比较,随便写几个单词

将这个本地文件复制到hdfs中

$ hadoop fs -put examples/test 

 

二 运行自带的WordCount

$ hadoop jar hadoop-mapreduce-examples-3.1.0.jar wordcount test out

程序运行完后 查看当前hadoop文件  

发现除了我们自己put进来的test还多生成了一个out目录 

查看part-r-00000这个文件

发现就是刚刚文本统计的结果

 

   

 

 三.遇到的问题以及解决方案

    1.运行自带的例子  提示找不到或无法加载主类org.apache.hadoop.mapreduce.v2.app.MRAppMaster

   解决方案:没有classpath导致的  添加classpath即可

   a)hadoop classpath 复制下来打印内容

   b)编辑 ${HADOOP_HOME}/etc/hadoop/yarn-site.xml 添加yarn.application.classpath,将刚刚查看到的classpath添加即可

 

转载于:https://www.cnblogs.com/xingluo/p/9511684.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值