Hadoop介绍

hadoop框架中最核心的设计是为海量数据提供存储的HDFS和对数据进行计算的MapReduce
MapReduce的作业包括:1、从磁盘或者从网络读取数据,即IO密集工作;2、计算数据,即cpu密集工作
hadoop集群的整体性能取决于cpu、内存、网络以及存储之间的性能平衡,因此运营团队在选择机器配置时要针对不同的工作节点选择合适的硬件类型
一个基本的hadoop集群中的节点主要有
NameNode:负责协调集群中的数据存储 (相当于目录)
DataNode:存储被拆分的数据块(存具体的地址)
JobTracker:协调数据计算任务 (管理作业,把一个整的任务分成若干个小部分,它就是作为协调)
TaskTracker:负责执行由JobTracker指派的任务(在每个小机器上的任务)
SecondaryNameNode:帮助NameNode收集文件系统的运行状态。(NameNode的一个备份,是一个冷备份)


----------------------------------------------------------
在集群中,大部分的机器是作为Datanode和taskTracker工作的datanode/TaskTracker的硬件规格可以采用以下方案:
4个磁盘驱动(单盘1-2T),支持JBOD(Just Bunch of Disks,磁盘簇)
2个4核CPU,至少2-2.5GHz
16-24内存
千兆以太网
NameNode提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务,因此需要更多的RAM,于集群中的数据块数量相对应,并且需要优化RAM的内存通道宽带,采用双通道或三通道以上内存。硬件规格可以采用以下方案:
8-12个磁盘驱动器(单盘1-2)T
2个4核/8核CPU
16-72GB内存
千兆/万兆以太网

SecondaryNameNode在小型集群中可以和NameNode共用一台机器,较大的群集可以采用与NameNode相同的硬件。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值