Hadoop及其组件介绍

一、Hadoop简介
  Hadoop来源于Google的GFS论文,发表于2003年的10月,也是由Apache基金会所开发出的分布式系统基础架构。用户可以在不用了解分布式底层的实现细节情况下,开发分布式程序。充分利用主机集群的强大威力来进行数据的高速运算和存储等功能。Hadoop具有高容错性的特点,并且它的集群主机可以部署在低廉的硬件之上;而且它还提供了高吞吐量来访问应用程序的数据,适合用来处理超大数据集,而且它还可以以数据流的形式来访问文件系统中的数据。Hadoop的出现就是为了解决大数据(单台主机无法对数据进行存储和短时间内对数据进行处理)的问题。
 
二、Hadoop中的集群 
Hadoop基本集群的节点类型主要有:
  1)NameNode(名称节点):主要用来协调集群中的数据存储,管理HDFS的名称空间和数据块映射的信息,配置文件副本策略和处理客户端的请求。
  2)DataNode(数据节点):主要是存储实际被拆分的数据块,并汇报存储信息给NameNode。
  3)Secondary NameNode(辅助节点):主要用来辅助NameNode节点,帮助NameNode收集文件系统运行的状态信息,分担其工作量。
  4)ResourceManager:在YARN中。负责集群中所有资源的统一管理和分配,它接受来自各节点资源汇报信息,并把这些信息按照一定的策略分配给各个应用程序。
  5)JobTracker:协调数据计算任务。
  6)TaskTracker:负责执行有JobTra

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值