HDFS的存储机制

  1. HDFS对文件分割后进行存放
  2. HDFS将要存储的大文件进行分割,分割后存储在既定的存储快中,并通过预先设定的优化处理,
  3. 一个HDFS集群包括两大部分NameNode与DataNode(一个NameData与多个DataNode)。
  4. NameNode是集群的主服务器,主要用于对HDFS中所有文件及内容数据进行维护,并不断读取记录集群中DataNode主机情况与工作状态,并通过读取与写入镜像文件的方式进行存储。
  5. DataNode在HDFS集群中担任任务具体执行角色,是集群的工作节点。文件分成若干个大小相同的数据块,分别存储在若干个DataNoide上,DataNode会定期向集群内NameNode发送自己的运行状态与存储内容,并根据NameNode发送的指令进行工作。
  6. NameNode负责接受客户端发送过来的信息,然后将文件存储位置信息发送给提交请求的客户端,有客户端直接与DataNode进行联系,从未进行部分文件的运算与操作。
  7. Block是HDFS的基本存储单元,默认为128M。
  8. HDFS还可以对已存储的Block进行多副本备份,将每个Block至少复制到3个相互独立的硬件上,这样可以快速恢复损坏的数据。
  9. 用户可以使用既定的API接口对HDFS文件进行操作
  10. 当客户端的读取操作发生错误的时候,客户端会向NameNode报告错误,并请求NameNode将排除错误的DataNode重新根据距离排序,从而获得一个新的DataNode读取路径。如果所有的DataNode都报告读取失败,name整个任务就读取失败。
  11. 对于写出操作过程中出现错误,FSDataOutputStream并不会立即关闭。客户端向NameNode报告错误信息,并直接向提供备份的DataNode中写入数据。备份DataNode被升级为首选DataNode,并在其余2个DataNode中备份复制数据。NameNode对错误的DataNode进行标记以便后续对其进行处理。
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值