【Hadoop】入门介绍

Hadoop 优势
  1. 高可靠性:hadoop底层维护多个数据副本,所以即使hadoop某个计算元素或存储出现故障,也不会导致数据丢失
  2. 高扩展性:在集群间分配任务数据,可方便扩展节点
  3. 高效性:在MapReduce思想下,Hadoop是并行工作的,以加快任务处理速度
  4. 高容错性:能够自动将失败的任务重新分配
Hadoop 1.x和Hadoop 2.x 区别

在Hadoop 1.x时代,Hadoop中的MapReduce同时处理业务逻辑运算和资源的调度,耦合性较大,在Hadoop 2.x时代,增加了Yarn,Yarn只负责资源的调度, MapReduce只负责运算

在这里插入图片描述

HDFS架构介绍
  1. NameNode(nn):存储文件的元数据,如文件,文件目录结构,文件属性,以及每个文件的块列表和块所在的DataNode
  2. DataNode(dn):在文件系统存储文件块数据,以及块数据的校验和
  3. Secondary NameNode(2nn):用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照
YARN架构介绍
  1. ResourceManager(RM):
    (1)处理客户端请求
    (2)监控NodeManager
    (3)启动或监控ApplicationMaster
    (4)资源的分配与调度
  2. NodeManager(NM):
    (1)管理单个节点上的资源
    (2)处理来自ResourceManager的命令
    (3)处理来自ApplicationMaster的命令
  3. ApplicationMaster(AM):
    (1)负责数据的切分
    (2)为应用程序申请资源并分配给内部的任务
    (3)任务的监控与容错
  4. Container:
    Container是YARN中的资源抽象,它封装了某个节点上地多维度资源,如内存,CPU,磁盘,网络等
    在这里插入图片描述
MapReduce构架介绍

MapReduce将计算过程分为Map和Reduce
1)Map阶段并行处理输入数据
2)Reduce阶段对Map结果进行汇总

大数据技术生态体系

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值