安装Hadoop预备知识

1、单机模式、伪分布模式、分布式模式

  • 单机模式和伪分布模式主要用于开发和测试环境,它们在单台机器上模拟分布式系统的不同方面。
  • 分布式模式是生产环境中的部署方式,它在多台机器上运行,以实现真正的并行处理和负载均衡。
  • 名称节点和数据节点是 HDFS 的两个关键组件,分别负责文件系统的管理和数据的存储
    在这里插入图片描述
  • 单机模式(Single Node Mode)
    定义:在单机模式下,所有的分布式计算组件都运行在同一台机器上。这种模式主要用于开发和测试,因为它可以简化配置和部署过程。
    特点:没有网络通信开销,所有操作都在本地进行,但无法模拟真实的分布式环境。
  • 伪分布模式(Pseudo-Distributed Mode)
    定义:伪分布模式是分布式计算框架的另一种配置,它在单台机器上模拟分布式系统的行为。与单机模式不同,伪分布模式会启动多个进程,每个进程模拟一个分布式系统中的不同节点。
    特点:虽然所有进程都在一台机器上运行,但它们之间会通过网络通信,以模拟分布式环境中的节点间通信。这种模式适用于测试分布式系统的功能。
  • 分布式模式(Distributed Mode)
    定义:在分布式模式下,计算框架的组件分布在多台机器上,每台机器都扮演一个或多个节点的角色。这是生产环境中最常见的部署方式。
    特点:可以充分利用集群资源,提高计算和存储能力。网络通信成为性能的关键因素,需要考虑数据传输和节点间协调。
  • 名称节点(NameNode)
    定义:在 Hadoop分布式文件系统(HDFS)中,名称节点是主控节点,负责管理文件系统的命名空间客户端对文件的访问
    职责:名称节点存储了文件系统的元数据,包括文件和目录的名称、权限、修改时间等,以及文件到数据块的映射信息。它不存储实际的数据块,这些数据块存储在数据节点上。
  • 数据节点(DataNode)
    定义:数据节点是 HDFS 中的工作节点,负责存储实际的数据块并响应名称节点的命令。
    职责:数据节点执行数据块的创建、删除和复制等操作,同时定期向名称节点报告自己的状态和存储的数据块信息。
    在这里插入图片描述

2、Hadoop安装包目录结构

在这里插入图片描述

3、HDFS的结构与管理

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值