大数据学习之hadoop——08NameNode、DataNode工作机制、原理

最新推荐文章于 2022-09-27 11:26:21 发布

上苍保佑吃饱饭的人们

最新推荐文章于 2022-09-27 11:26:21 发布

阅读量402

点赞数

分类专栏：大数据学习之hadoop 文章标签： hadoop java 大数据

本文链接：https://blog.csdn.net/nothair/article/details/104956763

版权

本文深入探讨了Hadoop中NameNode的原理，包括磁盘与内存的使用、运行机制和checkpoint合并。同时，详细解析了DataNode的两种文件、工作机制及动态服役、退役节点的过程。内容涵盖了NameNode的fsimage和edits文件，以及SecondaryNameNode在检查点合并中的作用。

摘要由CSDN通过智能技术生成

NameNode原理

1、磁盘与内存

在NameNode开始服务时，将会读取磁盘上的edits，fsimage文件，在内存(缓存)使用这些数据
读到内存中使用的原因：和磁盘多次交互会导致效率变低，从内存增删改查则是高效的选择（例：对文件进行2000000次相同内容的删除增加，在内存中执行此操作，到最后到磁盘上的结果就是什么都没发生）

2、NameNode运行原理

edits：编辑日志（操作过程数据）
fsimages：镜像文件（某一时刻的完整状态，HDFS只会保存最新的两个镜像文件）

2.1、在hdfs第一次启动时，会在name目录下创建edits和fsimage文件。在之后的启动过程中，HDFS会把磁盘中最新的fsimage文件和edits文件加载到内存中，并且同时创建edits.inprogress文件。
2.2、edits文件分为两种，正在运行的文件系统将操作存储至edits_improgressxxx文件，在集群关闭或者进行滚动日志时该文件将转化为edits_xxx文件，如果是日志滚动将会生成新的edits_improgressxxx文件
2.3、例2：有一家公司的财务需要每两个月清算一下账单，清算结束后将结果布告。在这两个月中公司的所有进出账都会进行记录，并且浮动资金超过30%就要清算一次变成小账本，所以这两个月中可能只有一个小账本也可能有多个小账本。到了两个月就将所有小账本其合并至总账单中。如果工商局在一个半月的时候突然要求查看所有账单，那么进行合并将会是上次结算的总账单&#x

最低0.47元/天解锁文章

上苍保佑吃饱饭的人们

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据学习之hadoop——08NameNode、DataNode工作机制、原理

NameNode原理问题：如何存元数据？、如何保证集群的状态？1、两种文件edits：临时的操作过程数据fsimages：某一时刻的最终完整状态在hdfs文件系统开始服务时，将会读取磁盘上的一些文件、配置等等，在内存(缓存)使用这些数据原因：和磁盘多次交互会导致效率变低，从内存读取则是高效的选择在hdfs第一次启动时，会在name目录下创建edits和fsimage文件，hdfs...
复制链接

扫一扫

专栏目录