Hadoop 初探——配置完成后第二天如何查看并验证(单机版)
一、运行Hadoop(Linux Ubuntu虚拟机下)
1.进入/hadoop-3.1.4文件夹下,输入命令sbin/start-dfs.sh。出现如下结果即为成功。
2.使用jps命令查看namenode和datanode数量。
3.输入netstat -tpnl | grep java 查看当前可用端口。
4.在Ubuntu的浏览器中输入http://lin:9870查看网页版信息。
说明:lin对应的即为我本机的端口号192.168.221.128,后面的9870在上图中除了本机外选择其余的一个即可。
二、运行wordcount demo
参考:https://www.cnblogs.com/lijingchn/p/5574476.html
1.在本地新建一个.txt文件。输入cat>haha.txt<ENTER>后输入文件内容
说明:输入cat haha.txt可以查看文件内容。
2.在分布式文件系统(hdfs)中新建一个test文件夹,用于上传我们的测试文件haha.txt。
在/hadoop-3.1.4目录下运行如下命令:4.
# 在hdfs的根目录下建立了一个test目录
bin/hdfs dfs -mkdir /test
# 查看HDFS根目录下的目录结构
bin/hdfs dfs -ls /
结果如下:
3.将本地haha.txt文件上传到test目录中。
# 上传
bin/hdfs dfs -put /home/hadoop/haha.txt /test/
# 查看
bin/hdfs dfs -ls /test/
结果如下:
4.运行wordcount demo。
# 将运行结果保存在/test/out目录下
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.4.jar wordcount /test/haha.txt /test/out
# 查看/test/out目录下的文件
bin/hdfs dfs -ls /test/out
结果如下:
5. 查看运行结果。
# 查看part-r-00000中的运行结果
bin/hadoop fs -cat /test/out/part-r-00000
结果如下: