hadoop基础知识

HDFS优势

1、高容错性:提供副本的方式提高容错性
2、适合批处理:移动计算不是移动数据处理
3、适合大数据处理:GB或者TB级别的数据
4、流式文件访问:一次写入,只能追加不能修改
5 、可构建在廉价机器上:

HDFS劣势

1、低延时数据访问:
2、小文件处理:文件名放在namenode里。
3、并发写入,文件随机修改:不支持修改文件。

1.0HDFS基本架构

在这里插入图片描述

HDFS2新特性

nameNode HA

1、基于NFS共享存储解决方案
2、基于Qurom Journal Manager(QJM)解决方案

NameNode Federation

1、存在多个NameNode,每个NameNode分管一部分目录
2、NameNode共用DataNode

Hadoop HA架构师

在这里插入图片描述

MapReduce的编程模型

在这里插入图片描述

MapReduce-编程模型–Combiner

在这里插入图片描述

MapReduce-编程模型–Partitioner

在这里插入图片描述

MapReduce-基本架构

在这里插入图片描述

jobtracker

1、负责资源管理和作业调度
2、负责将作业分解成一系列任务
3、负责将作业指派给TaskTracker
4、负责任务的监控以及错误日志处理

TaskTracker

1、负责运行Map Task和Reduce Task
2、它与JobTracker进行交互,执行jobtracker下达的命令,并向
jobtracker汇报任务状态。

Yarn基本架构

在这里插入图片描述

ResourceManager

1、处理客户端请求。
2、启动或者监控ApplicationMaster。
3、监控NodeManager。
4、资源的分配和调度。

NodeManager

1、单个节点上的资源管理。
2、处理来自ResouceManager的命令。
3、处理来自ApplicationMaster的命令。

ApplicationMaster

1、负责数据的切分。
2、为应用程序申请资源并分配给内部的任务。
3、任务的监控与容错。

Container

1、对任务运行环境进行抽象,封装了CPU,内存等多维度的资源以及环境变量,启动命令等任务运行相关的信息。

yarn的工作原理

在这里插入图片描述

flume og架构图

在这里插入图片描述
在这里插入图片描述

flume Ng架构图

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值