Linux查看Hadoop集群,Hadoop实战之Hadoop集群功能简单测试验证

前几天对Hadoop分布式集群的安装过程进行了总结,对hadoop的集群搭建只是学习hadoop中的艰难的一步,后面还需要学习更多的知识,不知道自己能不能坚持下去,不知道后面还会遇到多少困难,不过,我想,只要努力坚持下去,困难总是能够解决的。这次主要总结对hadoop集群测试相关的内容,对每个程序员而言,实践是最好的老师,这个过程就好比初学编程时,学了很多理论知识,表面上知道是那么一回事,一旦实践起来,就手忙脚乱了,如果不实践总觉得欠缺了什么,下面来测试一下对前几天安装好的hadoop集群,看看它到底好不好使?

这次测试主要分两步,hdfs和map-reduce,看这两个部分的功能是否正常:

一验证hadoop的hdfs文件系统功能是否正常

但是,应该如何验证呢?我们知道,一个文件系统是用于处理文件相关的系统,包括文件的复制,删除,查看等,如果说它有这些功能,那就表示文件系统是正常的。但是在我面前还是有一个问题,目前安装好的hadoop集群环境,它的hdfs文件系统上应该是空的,首先得给它加点料才行,换句话说,从linux角度看,就是如何从linux的文件系统将文件拷贝至hadoop的hdfs中,这显然是最基本的操作。其实这些问题,hadoop已经帮我们想好了,这里,我们先把料准备好,也就是要上传到hadoop的hdfs系统上的内容,过程如下:

ffc3cfba06c59a6042855fe85fcdf3e8.png

在这里,先建立两个普通的文件test1.txt和test2.txt,里面编写了几个单词。将这两个文件存放在linux的input目录下。紧接着,需要以某种方式将这两个文件上传至hdfs文件系统中,这个过程主要靠以下命令完成:

d407d1c9b056feb9986d4655afd3ae06.png

hadoop:为程序名称

dfs: 程序带的一个参数,这个参数主要表示要操作的是dfs文件系统

-put: 程序带的一个参数,这个参数表示要将“上传”这个动作

./: 程序带的一个参数,这个参数表示上传的源文件路径,在本例中,表示要将input目录下的文件上传,所以为./

in: 这个参数表示上传文件的目的地址(路径), 此时上传至hdfs的主目录下的in目录中

第二条指令为显示hdfs文件系统中in目录下的文件内容。这些操作和linux有点类似,区别在于,hadoop系统将linux系统中的shell命令操作作为hdfs文件系统的参数来执行操作,我认为这是一个好的思路,至少可以让熟悉linux的朋友对hadoop感觉比较友好。通过第二条命令的显示,可以看出,我们已经成功地将两个文件test1.txt和test2.txt上传了,也成功在hadoop的hdfs文件系统中显示in目录下的文件操作。

但是还是不够,我得试着看看能否在hdfs中实现文件的复制功能,如下:

e96bc92c2aa764c5a3fe8e3de3d5c261.png

上述命令将test1.txt文件生成一个拷贝,名称为test1.txt.bak,通过看hdfs系统中的in目录,可以看到这步操作是成功的。那么,在hdfs文件系统中如何删除一个文件呢?其实也很简单,如下图:

fc61f62558464a73420166dc9afbba21.png

可以看到,前面文件的拷贝test1.txt.bak已经被成功删除了。竟然我们可以将文件上传到hadoop的文件系统中,那也应该可以将hadoop中的hdfs中的文件给下载下来,这种实现也很简单,与上传类似,只要将参数-put,改为-get即可,如下图:

5fcc09c5d6fb022733a4e417a43a21d6.png

上述命令中,先创建一个空目录,名为dir_from_hdfs,然后从hdfs中下载刚上传的两文件,并将其成功下载至dir_from_hdfs中。

到这里,我们简单地总结一下前面的操作:

1 成功将linux文件系统中的文件拷贝至hdfs文件系统中的某一个路径下: hadoop dfs -put linux源文件路径 hadoop的hdfs文件路径

2 成功将hdfs文件系统中的文件拷贝至linux文件系统中的某一个路径下: hadoop dfs -get hadoop的hdfs文件路径 linux源文件路径

3 知道如何显示hdfs文件系统中的文件: hadoop dfs -ls hdfs的文件路径

4 知道如何在hdfs文件系统制作文件的副本: hadoop dfs -cp 原文件 目标文件

5 知道如何在hdfs文件系统中删除某一个文件: hadoop dfs -rm 要被删除的目标文件

6 如果要删除hdfs上的文件目录呢?这里不再展示,直接命令:hadoop dfs -rmr hdfs系统上的文件目录名

通过以上步骤的实践,已经可以证明前次安装的hadoop集群中的hdfs文件系统是能正常工作的。0b1331709591d260c1c78e86d0c51c18.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值