图解HDFS读写文件机制

最新推荐文章于 2023-04-17 19:13:16 发布

Even710

最新推荐文章于 2023-04-17 19:13:16 发布

阅读量441

点赞数

分类专栏： Hadoop 文章标签： hdfs 读写

本文链接：https://blog.csdn.net/weixin_37581297/article/details/84633121

版权

HDFS写文件流程

在这里插入图片描述
关键点：

hadoop2.x版本默认块大小为128M，所以预处理文件时，对200M的文件分块就是分成128M和72M。
第二步前，namenode需要根据client传递过来的消息来判断是否可以写文件，判断依据有是否存在目录，是否已存在文件等。
namenode选取datanode时可以遵循机架感知策略来选择机器。默认情况没有开启，是随机选择机器。如果需要开启，需要在hadoop-site.xml文件添加，value指定一个可执行程序，输入为datenode，输出为机架。需要人为编写，一般策略是第一个副本放在一个机架，第二个副本放在和每一个副本同一个机架的机器上，第三个副本放在另一个机架的机器上。
block传输完毕后，DataNode通知NameNode是为了让NameNode回滚日志，记录更新。

在这里插入图片描述

关键点：

关注