小练习:利用Wordcount计数
操作要求:
step1:
在home目录下创建文件wordcount.txt,内容如下:
hello ZWW
hello ljr
hello zzz
hello jjj
hello rrr
hello www
hello ljr
hello zww
hello lir
hello www
hello lalala
step2:
在hdfs创建存放wordcount.txt文件的目录/wc/input/
将刚才创建的wordcount.txt上传到hdfs的/wc/output/
step3:
执行hadoop官方提供的mapreduce的wordcount的例子
hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /wc/input/wordcount.txt /wc/output/
命令说明:
hadoop jar :用hadoop发方式运行jar文件
hadoop-mapreduce-examples-2.8.0.jar:具体的jar文件
wordcount:jar文件中的具体类
/wc/input/wordcount.txt:wordcount类运行需要的第一个参数,hdfs文件系统的输入目录
/wc/output/:wordcount类运行需要的第二个参数,hdfs文件系统的输出目录
step4:
查看执行完wordcount后,hdfs的输出目录,
学习大数据hadoop的第六天
最新推荐文章于 2024-08-08 10:34:27 发布
本文介绍了使用Hadoop进行Wordcount计数的步骤,包括在本地创建wordcount.txt文件,将其上传到HDFS的/wc/input/目录,通过hadoop jar命令运行wordcount示例,最后展示并解释了计算结果。
摘要由CSDN通过智能技术生成