hadoop集群swap_hadoop集群优化

本文主要探讨了Hadoop集群的硬件选择,包括NameNode和从节点的配置建议,以及如何避免使用swap分区。此外,还介绍了操作系统和JVM的调优策略,如调整内存分配策略和禁用THP。对于YARN和MapReduce的调优,文章提到了资源分配、内存和CPU核数的设定,以提高集群性能。
摘要由CSDN通过智能技术生成

硬件选择

如何选择合适的硬件

主节点:

NameNode的内存决定了集群保存文件数的总量。ResourceManager同时运行的作业会消耗一定的内存。

4-6块 1TB 硬盘(1块给操作系统,2块给FS image [RAID 1],1块给Zookeeper , 一块给Journal Node)

2 个 16/32 核心处理器,主频至少为 2-3GHz

64 – 128G 内存

万兆网卡

从节点:

从节点的内存需要根据cpu的虚拟核数(vcore)进行配比,cpu的vcore数计算公式为=cpu个数单cpu核数ht(超线程数),内存容量大小=vcore数*2GB(至少2GB)

12-24块1-4TB硬盘

2个 16/32核心处理器,主频至少2-2.5GHz

64-256G 内存

万兆网卡(存储密度越高,需要的网络网络吞吐越高)

如果集群的主机数超过20,那么推荐将集群划分为2个机架,每个机架配备一个万兆的顶层交换机

节点数量:根据数据量确定集群规模

举个栗子:全量起始1TB,每天增加10G

一年:

(1TB+10GB365)3*1.3=17.8TB

节点数=18TB/2TB=9

总节点数=9+2=1

还要考虑作业并不是均匀分布,有可能会倾斜到某一个时间段,需要预留资源。

交换机选项:不要让网络I/O成为瓶颈

hadoop作业通常是I/O密集型而非计算密集型,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值