一、HDFS——核心参数
1.NameNode内存生产配置
1)NameNode内存计算
每个文件大概占用150字节,一台服务器128G内存为例,能存储128*1024*1024*1024/150Byte=9.1亿 约等于9亿块
2)Hadoop2.x配置NameNode内存
NameNode内存默认2000M,如果服务器内存4G,NameNode内存可以配置3g,在hadoop-env,.sh文件中配置HADOOP_NAMENODE_OPTS=-Xmx3072m
3)hadoop3.x 配置NameNode内存
hadoop-env.sh中描述Hadoop的内存是动态分配的,NameNode和DataNode占用内存都是自动分配的
2.开始回收站配置
开启回收站功能,可以将删除的文件在不超时的情况下,恢复原数据,起到防止误删除、备份等作用。

本文详述了HDFS的生产调优,包括NameNode内存配置、回收站功能、集群压测、多目录配置、集群扩容缩容、存储优化如纠删码和异构存储,以及MapReduce生产经验,探讨了数据倾斜问题和提高MR效率的策略。
最低0.47元/天 解锁文章
493

被折叠的 条评论
为什么被折叠?



