NameNode运行原理浅析

最新推荐文章于 2022-08-24 09:17:31 发布

pany8125

最新推荐文章于 2022-08-24 09:17:31 发布

阅读量519

点赞数

分类专栏： hdfs hadoop 文章标签： hadoop namenode

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pany8125/article/details/49944323

版权

hadoop 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

hadoop版本： Apache Hadoop 2.6.0

instance的role type主要有3个，namenode，secondary namenode和data node；其他的还有balancer，backup node等

1.HDFS存储在本地操作系统磁盘的目录结构

NameNode：

/data/dfs/nn/current

-rw-r--r-- 1 hdfs hdfs 322K Apr 17 08:41 edits_0000000000007093753-0000000000007096223

-rw-r--r-- 1 hdfs hdfs 338K Apr 17 09:41 edits_0000000000007096224-0000000000007098803

-rw-r--r-- 1 hdfs hdfs 361K Apr 17 10:41 edits_0000000000007098804-0000000000007101548

-rw-r--r-- 1 hdfs hdfs 1.0M Apr 17 11:13 edits_inprogress_0000000000007101549

-rw-r--r-- 1 hdfs hdfs 53M Apr 17 09:41 fsimage_0000000000007098803

-rw-r--r-- 1 hdfs hdfs 62 Apr 17 09:41 fsimage_0000000000007098803.md5

-rw-r--r-- 1 hdfs hdfs 53M Apr 17 10:41 fsimage_0000000000007101548

-rw-r--r-- 1 hdfs hdfs 62 Apr 17 10:41 fsimage_0000000000007101548.md5

-rw-r--r-- 1 hdfs hdfs 8 Apr 17 10:41 seen_txid

-rw-r--r-- 1 hdfs hdfs 173 Nov 13 12:05 VERSION

Secondary NameNode：

/data1/dfs/snn/current

-rw-r--r-- 1 hdfs hdfs 322K Apr 17 08:41 edits_0000000000007093753-0000000000007096223

-rw-r--r-- 1 hdfs hdfs 338K Apr 17 09:41 edits_0000000000007096224-0000000000007098803

-rw-r--r-- 1 hdfs hdfs 361K Apr 17 10:41 edits_0000000000007098804-0000000000007101548

-rw-r--r-- 1 hdfs hdfs 53M Apr 17 09:41 fsimage_0000000000007098803

-rw-r--r-- 1 hdfs hdfs 62 Apr 17 09:41 fsimage_0000000000007098803.md5

-rw-r--r-- 1 hdfs hdfs 53M Apr 17 10:41 fsimage_0000000000007101548

-rw-r--r-- 1 hdfs hdfs 62 Apr 17 10:41 fsimage_0000000000007101548.md5

-rw-r--r-- 1 hdfs hdfs 173 Apr 17 10:41 VERSION

2.NameNode中一共有4种文件：

edits_{x}_{y}：和fsimage已经merger过的 transaction记录文件，x为起始transaction记号，y为截止号

edits_inprogress_{y}：尚未和fsimage merger过的 transaction记录文件， y为 transaction 截止号

fsimage_{y}：namenode的namespace存在本地的checkpoint文件，存储了y为 transaction 截止号；一般会有两个，文件生成时间间隔为设置的checkpoint生成间隔时间；

*NameNode上只有在启动时才会合并最新的fsimage_{y}和edits_inprogress_{y}文件

NameNode时序图：

上图中第三步最新的配置为：

1. fs.checkpoint.period, dfs.namenode.checkpoint.period： The time between two periodic file system checkpoints.

2. dfs.namenode.checkpoint.txns: The number of transactions after which the NameNode or SecondaryNameNode will create a checkpoint of the namespace, regardless of whether the checkpoint period has expired.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NameNode运行原理浅析

hadoop版本：Apache Hadoop 2.6.0instance的role type主要有3个，namenode，secondary namenode和data node；其他的还有balancer，backup node等
复制链接

扫一扫

专栏目录

pany8125 CSDN认证博客专家 CSDN认证企业博客

码龄16年

8: 原创

43万+: 周排名

148万+: 总排名

5万+: 访问

: 等级

724: 积分

7: 粉丝

2: 获赞

4: 评论

14: 收藏

私信

关注

热门文章

分类专栏

mysql 1篇
hive 6篇
git 4篇
spring 1篇
web 6篇
linux 5篇
tcp/ip 1篇
tomcat 1篇
log4j 1篇
oozie 2篇
CDH 4篇
avro
flume 1篇
hadoop 3篇
java 4篇
hdfs 1篇
career 3篇
frontend 1篇
redis 2篇
datawarehouse 1篇
nginx 1篇
openresty 1篇
lua 1篇

最新评论

Cloudera 从5.2.0升级到最新5.8.2的官方文档翻译
cindysz110: 博主你好，请问你做了rolling upgrade的CDH集群版本是express还是enterprise？现在最新版本的CDH5.X文档里面写着express不支持rolling upgrade。谢谢！
git基本命令
pany8125: 原文链接： https://github.com/michaelliao/learngit/blob/master/Git%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/git%E5%9F%BA%E6%9C%AC%E5%91%BD%E4%BB%A4%E9%9B%86%E5%90%88
wireshark抓包图解 TCP三次握手/四次挥手详解
pany8125: linux下可以用tcpdump抓包分析
wireshark抓包图解 TCP三次握手/四次挥手详解
pany8125: 在TCP层，有个FLAGS字段，这个字段有以下几个标识：SYN, FIN, ACK, PSH, RST, URG. 其中，对于我们日常的分析有用的就是前面的五个字段。它们的含义是： SYN表示建立连接， FIN表示关闭连接， ACK表示响应， PSH表示有 DATA数据传输， RST表示连接重置。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。