hdfs单点故障和内存受限问题

最新推荐文章于 2022-04-04 18:07:57 发布

温文尔雅的流氓

最新推荐文章于 2022-04-04 18:07:57 发布

阅读量3k

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hll19950830/article/details/79830679

版权

Hadoop 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1. 解决hdfs单点故障问题的方法

HDFS HA：通过主备NameNode解决一个集群中只能有一个NameNode处于工作状态当主NameNode发送故障则切换到备NameNode上（NameNode的两大功能：接收客户端的读写请求存储元数据）

整个集群在输入hdfs namenode -format时产生元数据此时hdfs集群还没有启动主NameNode会格式化产生（初始化）fsimage 而备NameNode则不会产生fsimage 因为如果两个都格式化产生fsimage的话由于环境和系统时间的不同fsimage一定会不同从而导致主NameNode在发生故障时备NameNode无法接管正确的情况应该是在主NameNode格式化后备NameNode把主NameNode的fsimage拷贝过来以保证初始化时两个NameNode的元数据一模一样为以后的成功接管提供条件

edits文件在客户端对hdfs进行操作时产生当有元数据的增删改查日志产生时它会直接保存到一个内部的集群中称之为JournalNode 一般会有2个或3个以上的副本同时fsimage文件和edits文件的合并工作也由JournalNode完成主NameNode（Active）挂了之后备NameNode（Standby）接管后会同样会把日志保存到JournalNode中

JournalNode在合并fsimage和edits文件以更新fsimage文件时需要同时合并两个NameNode的fsimage 从而保证瞬间实现接管

DataNode在启动的时候会向两个NameNode汇报block的位置信息从而保证瞬间实现接管

备NameNode与主NameNode相比仅仅少了接收客户端读写请求的工作其他的一模一样因为内存中的元数据来源于hdfs在启动时从磁盘读入的fsimage 初始化时两台NameNode上的fsimage是一模一样的因此在启动之初两个NameNode加载到内存中的元数据是一模一样的 DataNode在启动的时候向两个NameNode汇报block的位置信息以元数据的形式存在于两个NameNode的内存中因此两个NameNode中的元数据是又是一模一样的 edits文件保存在共享的集群中和fsimage合并后也是一样的

备NameNode在接管主NameNode时只要正常接收客户端的读写请求功能即可因此可以实现瞬间接管

接管的先决条件是两台NameNode上的元数据一模一样

2. 解决hdfs内存受限问题的方法

为什么会出现内存受限：当数据量太大时 NameNode中元数据占用的空间也会很大内存太小不足以保存

国内大部分公司的解决方法：加集群即根据业务的不同使用多个集群分别存储同一个业务如果数据量过大也可以根据时间的不同使用多个集群分别存储

官方提供的解决方法：HDFS Federation（联邦）

它可以水平扩展支持多个NameNode 每个NameNode分管一部分目录所有DataNode共享所有NameNode的资源

温文尔雅的流氓

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。