【分布式】hadoop安装篇（5）验证和一些命令

最新推荐文章于 2023-07-12 02:19:44 发布

恺风

最新推荐文章于 2023-07-12 02:19:44 发布

阅读量824

点赞数

分类专栏：分布式恺风（Wei）之分布式学习笔记

本文链接：https://blog.csdn.net/flowingflying/article/details/80758191

版权

恺风（Wei）之分布式学习笔记同时被 2 个专栏收录

13 篇文章 1 订阅

订阅专栏

分布式

12 篇文章 1 订阅

订阅专栏

在上一博文中，我们已经安装了Hadoop2.9的伪分布环境，我们需要对其进行一些验证。

验证

【在NDFS中创建目录，用于执行MapReduce jobs。】
$ hdfs dfs -mkdir /user             //这和linux的命令很是相识，前面加上-（-ls,-cat, -rmdir等等），这个目录是建在NDFS的img上的。
$ hdfs dfs -mkdir /user/<username>  //如果username为wei，此命令为hdfs dfs -mkdir /user/wei。注意这是缺省目录，但需要建立

【仍使用wordcount的例子进行检查】
【（1）上传输入到NDFS，统计的文件在本地名字为mytest.txt】
$ hdfs dfs -put mytest.txt input/mytest.txt //将本地当前目录的mytest.txt上传至NDFS的/user/wei/input/mytest.txt中
【（2）进行mapreduce的进行】
$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.0.jar wordcount input/mytest.txt output
【（3）查看结果，可以直接上NDFS查看，也可以导入到本地文件系统中查看】
【 3.1）直接在NDFS中查看】
$ hdfs dfs -ls output/
Found 2 items
-rw-r--r--   1 gsta supergroup          0 2018-05-18 11:21 output/_SUCCESS
-rw-r--r--   1 gsta supergroup         33 2018-05-18 11:21 output/part-r-00000
$ hdfs dfs -cat output/part-r-00000
Hello,  2
friend! 1
my      1
world!  1
【3.2）导入到本地文件系统中查看】
$ hdfs dfs -get output output  //hdfs dfs -get <src> <localdst>，将源输出的output，放入到本地目录output下，实际为output/output