Hadoop 相关介绍

目录

一、Hadoop介绍

二、Hadoop 架构

1、 Hadoop 1.x 架构

2、Hadoop 2.x 3.x 架构

三、HDFS介绍

1、HDFS架构

2、HDFS 特点

四、 Hadoop 之 MapReduce 初体验

1、使用上述的测试包, 计算圆周率

2、使用上述的测试包, 进行词频统计


一、Hadoop介绍

1. Hadoop之父:道格 卡丁 (Doug Cutting)

2. 吉祥物: 大象

3. Hadoop 解释:

狭义解释:指的是HDFS、MapReduce、Yarn等框架.

广义解释:指的是Hadoop生态圈,包括但不限于周边所有技术.

4. Hadoop组成:

HDFS(Hadoop distributed file system):Hadoop分布式文件存储系统

MapReduce:分布式计算框架

Yarn:分布式 任务接收和资源调度框架       

5. 分布式和集群:

分布式:多台机器做不同的事,组成一个整体.

集群: 多台机器做相同的事. 

多台机器可以组成 中心化模式 (主从模式),也可以组成 去中心化模式 (主备模式).   

二、Hadoop 架构

1、 Hadoop 1.x 架构

Hadoop 1.x = HDFS + MapReduce

HDFS集群中:

namenode 为主节点,负责管理整个HDFS集群 以及 维护和管理元数据.

SecondaryNameNode 为辅助节点,负责辅助namenode管理元数据.

datanode 为从节点,负责维护和管理源文件 、 数据的读、写操作 以及 定时向 namenode 报活.

MapReduce集群中:

JobTracker 为主节点,负责任务的接收、调度、监控 以及 资源的调度和分配.

TaskTracker 为从节点,负责接收并执行 JobTracker 分配过来的计算任务.

元数据:描述数据的数据称之为元数据.

由于 JobTarcker 任务过于繁重,容易宕机. 所以 2.x 3.x 架构有所改变.

2、Hadoop 2.x 3.x 架构

Hadoop 2.x 3.x = HDFS + MapReduce + Ya

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值