07-聊聊象群-介绍Hadoop集群

本文详细介绍了Hadoop集群的基本结构,包括Master节点(NameNode和Resource Manager)和Slave节点(DataNode和NodeManager)的功能。讨论了单节点集群与多节点集群的区别,并解释了Hadoop集群的通讯协议。此外,还强调了数据本地性的重要性,以及Hadoop集群的健壮性,如数据磁盘故障处理和负载均衡。最后,概述了Hadoop集群的管理和使用快照进行数据恢复的优势。
摘要由CSDN通过智能技术生成

Hadoop集群介绍

本章目标

  1. Hadoop集群概述
  2. Hadoop集群结构
  3. 数据本地性

1 Hadoop集群概述

本节我们将了解Hadoop框架的核心内容,Hadoop集群。首先,我们需要了解什么是Hadoop集群,然后,我们将了解它的基本结构和协议,最后,我们将讨论Hadoop集群给我们带来的各种好处。
接下来,我们就开始了解Hadoop集群。

Hadoop集群就是一组计算机通过LAN进行连接。我们使用它来存储和处理大数据集。Hadoop集群使用普通硬件互相连接。它们和一个扮演master角色的高端集群进行通讯。master和slave一起在分布式数据存储上实现分布式计算。集群上面运行开源的软件提供分布式功能。

2 Hadoop集群的基本结构

2.1 Hadoop集群中的Master节点

Hadoop集群具备主从结构。
作为Master节点的机器内存和CPU的配置要高一些。有两个进程会运行在master上面,它们是NameNode和Resource Manager

NameNode的功能

在这里插入图片描述

  • 管理文件系统的命名空间
  • 调度客户端对文件的访问
  • 存储实际数据的元数据,包括文件路径,数据块的数量,块id,块位置等等
  • 执行文件系统的命名空间操作,比如打开,关闭,重命名文件和目录等
    NameNode为了快速返回信息,需要在内存中存储元数据,因此应该选择配置高一些的机器。
Resource Manager的功能

在这里插入图片描述

  • 为发生资源冲突的节点仲裁资源
  • 跟踪节点的活动和死亡状态
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值