前言
上一节,讲解了HDFS的原理,以及相关的hadoop系统安装文档,参考文档可以轻松的搭建好,Hadoop伪分布式集群环境,这一节主要讲解一下如何操作HDFS,及HDFS文件的存储方式。
一、如何操作HDFS?
通过相关的途径我们可以对HDFS文件存储系统进行操作,上传文件,管理文件等一系列功能。
HDFS 常见的访问方式
- 通过Web Console
- 通过Shell命令
- 通过Jave API
一、通过Web Console
NameNode web管理端口50070,可以查看文件系统概况,数据节点信息,快照,目录结构及文件属性等。
如:在浏览器中输入192.168.80.138:50070,就可以查看HDFS的 Web界面。
注意:
- ip地址为namenode服务所在的服务器的ip地址
- 访问NameNode web管理的电脑需要与NameNode服务器处于局域网内(注意关闭防火墙等)
通过访问端口为50090的网页查看SecondaryNameNode的信息。
可以查看Hadoop的版本、NameNode的入口地址,以及Checkpoint等信息,如图所示。
通过NameNode web管理界面可以查看HDFS启动过程
单击菜单【Startup Progress】可以查看HDFS的启动过程,如图所示。可以看到HDFS启动经历了如下4个阶段。
(1