NameNode工作机制

最新推荐文章于 2024-02-04 17:06:21 发布

写吧HJ

最新推荐文章于 2024-02-04 17:06:21 发布

阅读量258

点赞数 1

分类专栏：大数据开发学习文章标签： hadoop 大数据 namenode 工作机制原理

本文链接：https://blog.csdn.net/weixin_43857365/article/details/89878706

版权

大数据开发学习专栏收录该内容

18 篇文章 2 订阅

订阅专栏

学习目标：理解namenode的工作机制尤其是元数据管理机制，以增强对HDFS工作原理的理解，及培养hadoop集群运营中“性能调优”、“namenode”故障问题的分析解决能力

问题场景：
1、集群启动后，可以查看文件，但是上传文件时报错，打开web页面可看到namenode正处于safemode状态，怎么处理？
2、Namenode服务器的磁盘故障导致namenode宕机，如何挽救集群及数据？
3、Namenode是否可以有多个？namenode内存要配置多大？namenode跟集群数据存储能力有关系吗？
4、文件的blocksize究竟调大好还是调小好？
……

诸如此类问题的回答，都需要基于对namenode自身的工作原理的深刻理解

NameNode职责

负责客户端请求的响应
元数据的管理（查询，修改）

元数据的管理

namenode对数据的管理采用了三种存储形式：

内存元数据(NameSystem meta data – 内存中)
磁盘元数据镜像文件(fsimage)
数据操作日志文件（edits = 可通过日志运算出元数据）

元数据存储机制

A、内存中有一份完整的元数据(内存meta data)
B、磁盘有一个“准完整”的元数据镜像（fsimage）文件(在namenode的工作目录中)
C、用于衔接内存metadata和持久化元数据镜像fsimage之间的操作日志（edits文件）注：当客户端对hdfs中的文件进行新增或者修改操作，操作记录首先被记入edits日志文件中，当客户端操作成功后，相应的元数据会更新到内存meta.data中

元数据查看方式

可以通过hdfs的一个工具来查看edits中的信息

bin/hdfs oev -i edits -o edits.xml
bin/hdfs oiv -i fsimage_0000000000000000087 -p XML -o fsimage.xml

元数据的checkpoint

每隔一段时间，会由secondary namenode将namenode上积累的所有edits和一个最新的fsimage下载到本地，并加载到内存进行merge（这个过程称为checkpoint）

如果开启了HA高可用，这一任务由StandBy NameNode来执行。

checkpoint的详细过程

在这里插入图片描述

checkpoint操作的触发条件配置参数

dfs.namenode.checkpoint.check.period=60  #检查触发条件是否满足的频率，60秒
dfs.namenode.checkpoint.dir=file://${hadoop.tmp.dir}/dfs/namesecondary
#以上两个参数做checkpoint操作时，secondary namenode的本地工作目录
dfs.namenode.checkpoint.edits.dir=${dfs.namenode.checkpoint.dir}

dfs.namenode.checkpoint.max-retries=3  #最大重试次数
dfs.namenode.checkpoint.period=3600  #两次checkpoint之间的时间间隔3600秒
dfs.namenode.checkpoint.txns=1000000 #两次checkpoint之间最大的操作记录

checkpoint的附带作用

namenode和secondary namenode的工作目录存储结构完全相同，所以，当namenode故障退出需要重新恢复时，可以从secondary namenode的工作目录中将fsimage拷贝到namenode的工作目录，以恢复namenode的元数据

写吧HJ

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NameNode工作机制

学习目标：理解namenode的工作机制尤其是元数据管理机制，以增强对HDFS工作原理的理解，及培养hadoop集群运营中“性能调优”、“namenode”故障问题的分析解决能力问题场景：1、集群启动后，可以查看文件，但是上传文件时报错，打开web页面可看到namenode正处于safemode状态，怎么处理？2、Namenode服务器的磁盘故障导致namenode宕机，如何挽救集群及数据？...
复制链接

扫一扫

专栏目录