Hadoop存储系统——基本概念及通信协议简介

Hadoop是一个分布式系统,其包括两大核心内容,一个是并行计算框架MapReduce,另一个就是分布式存储系统HDFS了。从分布式系统理论的角度考虑,一般的分布式系统需要考虑的核心问题包括:数据分块、元数据管理、高可靠性、高可用性、高可扩展性、容错控制、高吞吐量以及高传输等问题;从架构上来讲主流模型是P2P模型和主从结构模型,对外来讲只需要暴露一个统一的访问接口、对用户透明,而且要保护用户数据的一致性。

Hadoop的存储系统HDFS就是这样的一个分布式文件系统,HDFS使用廉价的商用硬件搭建系统并向大量用户提供可容错的高性能服务,并能提供高吞吐量的数据访问。Hadoop分布式文件系统是由一个Master和大量服务器Slave构成的。Master可存放文件系统的所有元数据,包括名称空间、访问控制、文件分块信息、文件块的位置信息等。HDFS中的文件默认切分为64MB的块进行存储。为了保证高可靠性和高可用性,采用冗余存储机制的方式来保存数据,每份数据在系统中至少保存3个以上的备份。为了保证数据的一致性,对于数据的修改需要在所有数据中进行,并用版本号的方式来确保所有备份处于一致的状态。HDFS作为Hadoop的基石为分布式计算框架MapReduce提供底层的分布式存储支撑。

NameNode 

HDFS采用Master/Slave架构,NameNode就是HDFS的Master架构,主要负责HDFS文件系统的管理工作,包括名称空间(namespace)管理,文件Block管理。NameNode提供的是始终被动接受服务的Server,他主要有三类协议接口(1、2、3):

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值