NameNode数据存储

最新推荐文章于 2024-05-14 22:46:33 发布

weixin_38166931

最新推荐文章于 2024-05-14 22:46:33 发布

阅读量1.2k

点赞数

文章标签：大数据

原文链接：http://www.cnblogs.com/zhichun/p/11396530.html

版权

HDFS架构图

HDFS原理

　　1) 三大组件　　

　　NameNode、 DataNode 、SecondaryNameNode

　　2）NameNode

　　　　存储元数据（文件名、创建时间、大小、权限、文件与block块映射关系）

　　3）DataNode

　　　　存储真实的数据信息

　　4)SecondaryNameNode

　　　　合并edits日志文件和fsimage镜像文件进行合并

　　

详细信息如下：

其中fsimage_0000000000000000000000属于镜像文件

see_txid操作事务id

其中fsimage_0000000000000000000000.md5属于校验和

VERSION属于版本号，详细信息如下：

(1)dfs.namenode.name.dir　　file://{$hadoop.tmp.dir}/dfs/name

hadoop.tmp.dir　　　　　　/tmp/hadoop-${user.name}

多次格式化的问题：

hdfs格式化会改变VERSION文件中的clusterID, 首次格式化时datanode和namenode会产生相同的clusterID;

如果重新执行格式化，namenode的clusterID改变，就会愈datanode的cluseterID不一致，如果重启或者读写hdfs，就会挂掉

(2)dfs.datanode.data.dir　　file://${hadoop.tmp.dir}/dfs/data

hadoop.tmp.dir　　　　　 /tmp/hadoop-${user.name}

例：/tmp/hadoop-root/dfs目录下：

name、data、namesecondary

(3)dfs.namenode.checkpoint.dir　　file://{hadoop.tmp.dir}/dfs/namesecondary

tmp/hadoop-${user.name}/dfs/name或者 tmp/hadoop-${user.name}/dfs/data下的datanode和namenode信息在系统

在重启时，会被清空处理。为了防止数据丢失，接下来我们更改路径存储，以namenode为例：

配置hdfs信息如下：将namenode数据存储在data/name下面

在执行格式化之前，查询data下的目录信息：

进行格式化：

hdfs namenode -format -force

格式化之后，在data/name/current下查看name信息

转载于:https://www.cnblogs.com/zhichun/p/11396530.html

weixin_38166931

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NameNode数据存储

HDFS架构图HDFS原理　　1) 三大组件　　　　NameNode、 DataNode 、SecondaryNameNode　　2）NameNode　　　　存储元数据（文件名、创建时间、大小、权限、文件与block块映射关系）　　3）DataNode　　　　存储真实的数据信息　　4)Secon...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。