HDFS所有功能汇总

本文详细介绍了HDFS的动机、目的及系统结构,包括数据块、NameNode、DataNode的角色和工作流程。讨论了HDFS的数据写入和读取过程,强调了NameNode的元数据管理和容错机制,以及DataNode的存储和心跳机制。
摘要由CSDN通过智能技术生成

1 HDFS原理分析

HDFS是Hadoop Distribute File System 的简称,也就是Hadoop的一个分布式文件系统。

https://blog.csdn.net/weixin_40035337/article/details/108006138

1.1 HDFS有什么动机和目的

1)提供较高的容错率,因为数据有备份,通过机架感知策略,namenode会尽量将数据的复本放到不同的机架上,所以小规模的宕机不影响数据的存储。

 

宕机:down 机,指操作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。

    

    2)可以使用低成本的硬件搭建一个分布式文件系统。

    3)能提供大规模的数据存储,上TB、PB级的规模。

    4)高吞吐(并发)的数据访问,获得一个完整的数据可以从多个机器上同时读取。

 

    

 

    数据不动计算动

    5)计算时数据读取的方式多采用本地化方式,如果本地化方式不满足则采用临近网络的方式,这也是通过机架感知策略。

 

1.2 HDFS的系统结构

 

/data --> HDFS的数据存储目录

HA:高可用。zookeeper ZKFC

----------------------------------------------

namenode:是大领导。管理数据块映射;处理客户端的读写请求。一般有一个active状态的namenode,有一个standby状态的namenode,其中,a

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值