如何规划HDFS容量？

最新推荐文章于 2024-07-23 10:48:19 发布

红星光芒照山谷

最新推荐文章于 2024-07-23 10:48:19 发布

阅读量361

点赞数 3

文章标签： hdfs hadoop 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/X2469974125/article/details/140100029

版权

一、基础介绍

HDFS DataNode以Block的形式，保存用户的文件和目录，同时在NameNode中生成一个文件对象，对应DataNode中每个文件、目录和Block。

NameNode文件对象需要占用一定的内存，消耗内存大小随文件对象的生成而线性递增。DataNode实际保存的文件和目录越多，NameNode文件对象总量增加，需要消耗更多的内存，使集群现有硬件可能会难以满足业务需求，且导致集群难以扩展。

规划存储大量文件的HDFS系统容量，就是规划NameNode的容量规格和DataNode的容量规格，并根据容量设置参数。

二、容量规格

①NameNode容量规格

在NameNode中，每个文件对象对应DataNode中的一个文件、目录或Block。一个文件至少占用一个Block，默认每个Block大小为“134217728”即128MB，对应参数为“dfs.blocksize”。默认情况下一个文件小于128MB时，只占用一个Block；文件大于128MB时，占用Block数为：文件大小/128MB。目录不占用Block。

根据“dfs.blocksize”，NameNode的文件对象数计算方法如下：

②DataNode容量规格

在HDFS中，Block以副本的形式存储在DataNode中，默认副本数为“3”，对应参数为“dfs.replication”。集群中所有DataNode角色实例保存的Block总数为：HDFS Block * 3。集群中每个DataNode实例平均保存的Blocks= HDFS Block * 3/DataNode节点数。

DataNode支持规格：

DataNode节点数规划：

三、内存参数设置

①NameNode JVM配置

②DataNode JVM配置

红星光芒照山谷

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
如何规划HDFS容量？

HDFS DataNode以Block的形式，保存用户的，同时在NameNode中生成一个，对应DataNode中每个文件、目录和Block。NameNode文件对象需要占用一定的内存，消耗内存大小随文件对象的生成而线性递增。DataNode实际保存的文件和目录越多，NameNode文件对象总量增加，需要消耗更多的内存，使集群现有硬件可能会难以满足业务需求，且导致集群难以扩展。规划存储大量文件的HDFS系统容量，就是规划NameNode的容量规格和DataNode的容量规格，并根据容量设置参数。
复制链接

扫一扫

红星光芒照山谷 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

110万+: 周排名

13万+: 总排名

2591: 访问

: 等级

92: 积分

36: 粉丝

52: 获赞

1: 评论

47: 收藏

私信

关注

热门文章

最新评论

HDFS集群数据节点巡检和修复
CSDN-Ada助手: 恭喜您开始了博客创作，标题内容也十分实用和有价值。建议下一步可以探讨一下HDFS集群数据节点巡检和修复的具体步骤和注意事项，以及在实践中可能遇到的问题和解决方案。期待您更多的分享和成长，加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。