hdfs中8031是什么端口号_Hadoop学习笔记之HDFS

本文介绍了Hadoop的分布式文件系统HDFS的系统架构,包括NameNode、Secondary NameNode和DataNode的角色。还讨论了HDFS的备份机制,以防NameNode故障,并提到了HDFS的交互方式主要是通过FS Shell命令。
摘要由CSDN通过智能技术生成

上文我们学习到,Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS,那这个HDFS到底是做什么的,用什么来实现的呢?本文我们来一起学习下!

cd432baba42c21e87908af07309e85e0.png

一、HDFS系统架构

HDFS采用了master/slave的架构,即主从复制机制,其中Master以写为主,Slave以读为主。

80f4ba7931359ade9add332ef7820c8b.png

图1

要学习HDFS,必须了解如下组件(参照图1):(重点已经标黑,便于记忆和理解)

NameNode:说白了就是负责系统文件的命名和文件和目录维护,以namespcae imageedit log两个文件形式永久保存在本地磁盘上。同时,NameNode也记录数据节点信息,但它并不永久保存块的位置信息,因为这些信息会在系统启动时由数据节点重建。

Secondary NameNode:主要任务是减少NameNode的系统压力,定期合并fsimage和edits日志,并传输给NameNode。同时将文件存储到磁盘上。

DataNode:这个好理解,datanode就是工作节点,实际存数据的节点。并且根据需要存储并检索数据块(受客户端或NameNode调度),并且定期向NameNode发送它们所存储的块的列表。

Client:客户端,通过POSIX的文件系统接口,访问整个文件系统。

二、HDFS系统备份机制

如果Namenode发生故障,怎么办?如图2,为了避免这种事情的发生,NameNode和Secondary NameNode会将元数据和namespace副本,分别存储在不同的文件系统中,用于NameNode不可用或者崩溃后的恢复使用。

503a1c30ebdc912f7b3f957ddcfb4817.png

图2

三、HDFS系统交互方式

最后,HDFS系统可以FS Shell命令进行操作,大家有兴趣的这部分可以自己学习下。其实大体上的操作和linux的基本操作差不多,平时多注意就行。

74befbd361c4ae77b5d2c30774fb352d.png

图3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值