【hadoop】HDFS原理和重要特性

最新推荐文章于 2023-09-06 21:08:43 发布

废物点心777

最新推荐文章于 2023-09-06 21:08:43 发布

阅读量767

点赞数

分类专栏： hadoop学习文章标签：大数据 hadoop 分布式 hdfs

本文链接：https://blog.csdn.net/weixin_45783164/article/details/105530379

版权

本文深入探讨了Hadoop的HDFS，包括NameNode和DataNode的角色，HDFS的工作机制，以及写入和读取数据的流程。重点强调了HDFS的主从架构、分块存储、元数据管理、副本机制和一次写入多次读出的重要特性。

摘要由CSDN通过智能技术生成

在这里插入图片描述

DataNode 负责将实际数据存储在 HDFS 中。
DataNode 也称为 Slave。
NameNode 和 DataNode 会保持不断通信。
DataNode 启动时，它将自己发布到 NameNode 并汇报自己负责持有的块列表。
当某个 DataNode 关闭时，它不会影响数据或群集的可用性。NameNode 将安排由其他 DataNode 管理的块进行副本复制。
DataNode 所在机器通常配置有大量的硬盘空间。因为实际数据存储在DataNode 中。
DataNode 会定期（dfs.heartbeat.interval 配置项配置，默认是 3 秒）向NameNode 发送心跳，如果 NameNode 长时间没有接受到 DataNode 发送的心跳， NameNode 就会认为该 DataNode 失效。
block 汇报时间间隔取参数 dfs.blockreport.intervalMsec,参数未配置的话默认为 6 小时.