HDFS生产调优大全

本文详述了HDFS的生产调优,包括NameNode内存配置、回收站功能、集群压测、多目录配置、集群扩容缩容、存储优化如纠删码和异构存储,以及MapReduce生产经验,探讨了数据倾斜问题和提高MR效率的策略。
摘要由CSDN通过智能技术生成

一、HDFS——核心参数

1.NameNode内存生产配置

1)NameNode内存计算

每个文件大概占用150字节,一台服务器128G内存为例,能存储128*1024*1024*1024/150Byte=9.1亿 约等于9亿块

2)Hadoop2.x配置NameNode内存

NameNode内存默认2000M,如果服务器内存4G,NameNode内存可以配置3g,在hadoop-env,.sh文件中配置HADOOP_NAMENODE_OPTS=-Xmx3072m

3)hadoop3.x 配置NameNode内存

hadoop-env.sh中描述Hadoop的内存是动态分配的,NameNode和DataNode占用内存都是自动分配的

2.开始回收站配置

开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。

二、HDFS—集群压测

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值