2.进入虚拟机浏览器地址栏localhost:50070和localhost:8088查看集群状态:
注:Wordcount是MapReduce的入门示例程序,相当于我们在学某个编程语言时写的Hello World示例一样。这个程序可以统计某个文件中,各个单词出现的次数。Wordcount程序自带的jar包已经放置在hadoop安装目录下的 /share/hadoop/mapreduce 文件夹中。
3.配置wordcount环境:
(1)进入Hadoop安装路径下可以看到:图中的txt文件为Hadoop自带的测试文件,这里将进行自定义文件进行操作。
(2)在这里我们新建wordcount.txt文件进行测试,文本内容如下:
(3)在HDFS根目录下新建input目录:
(4)将本地的wordcount.txt上传到HDFS的input目录下:
(5)查看文件是否上传成功:
注:如图出现/input和/input/wordcount.txt文件即为上传成功
4.运行wordcount案例:
注:使用hadoop jar命令 +mapreduce自带的jar包路径(绝对路径)+文件名+输入路径+输出路径 #此处jar包根据自身实际情况进行修改
运行过程注意观察这几处字样,即为运行成功:
最后
由于篇幅限制,小编在此截出几张知识讲解的图解
kq-1714548559904)]
[外链图片转存中…(img-FdrsQLyS-1714548559904)]
[外链图片转存中…(img-YYwDbNmc-1714548559905)]