HDFS设计简要

cheng_2022

已于 2024-09-21 09:59:25 修改

阅读量197

点赞数 5

文章标签： hdfs hadoop

于 2024-09-21 09:51:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cheng_jing_2022/article/details/142411588

版权

Hadoop1的问题：
namenode单点故障
namenode内存受限
Hadoop2的解决方案：HA 和联邦集群
HA：
jounalnode：负责同步activenamenode和standbynamenode的元数据。
zk和zkfc：负责监控namenode的状态，以及进行选举。

namenode启动流程
启动namenodeRpcServer
启动httpServer
加载元数据到内存
是否开启安全模式的三个条件：block块正常的数量占比，datanode存活节点占比，namenode保存元数据的空间是否足够，最小100M

datanode启动流程
注册：告诉namenode，自己的信息
心跳：周期性向namenode报告，namenode会返回操作指令。

namenode往磁盘写元数据时的设计
采用分段锁+双缓存
分段锁：只对内存操作加锁，性能不会受影响，磁盘写不加锁，因为这个过程比较耗时。
双缓存：namenode保存元数据时除了在内存中维持一份元数据，还要往磁盘写一份editlog（ha模式的话还要往journalNode写一份元数据）,为了支持高并发，使用双缓存设计对写磁盘进行了优化，直接写磁盘比较耗时，namenode不是直接往磁盘写元数据，而是开了两个内存块，
往第一个里面写元数据，达到一定条件后，两个内存块进行内存交换，然后从第二块内存写到磁盘。

一些问题

namenode 瞬时高并发导致短暂不可用
原因：editlog双缓存的两块内存大小被写死为512k，如果遇到高并发请求，写满第一块内存的时间比第二块内存溢写磁盘的时间短，那么namenode主线程会wait,导致不可提供服务。
解决方案：将双缓存内存大小改为可配置，适当提升大小，建议2M,即可解决。
namenode fullgc 引起存储元数据到jounalnode时超时导致进程退出
解决方案：超时的时候判断是否full gc引起，stopWatch计算代码执行时间
datanode锁优化，读写锁互斥导致性能不好，可以在高频调用的方法里细化加锁的粒度，提升性能。

关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

cheng_2022 CSDN认证博客专家 CSDN认证企业博客

码龄5年

12: 原创

4万+: 周排名

9万+: 总排名

3394: 访问

: 等级

175: 积分

35: 粉丝

51: 获赞

0: 评论

43: 收藏

私信

关注

热门文章

最新评论

flink sql的分组聚合
ha_lydms: 文章内容丰富、实用性强，结构合理，语言流畅，代码清晰，思路清晰，图文并茂，详略得当，三连支持，期待博主
flink维度关联实现方式
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
flink状态概念
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。