HDFS、组件和基本架构介绍

本文介绍了HDFS,即Hadoop分布式文件系统,它受到Google GFS的启发,由Java实现。HDFS包括NameNode(元数据管理者)、DataNode(数据节点)和Client(客户端)三个主要组件。NameNode负责文件系统的命名空间和数据块位置信息管理,DataNode执行数据块的读写操作,而Client则与NameNode和DataNode交互,提供对文件系统的访问。HDFS采用主从架构,NameNode管理元数据,DataNodes存储数据。
摘要由CSDN通过智能技术生成

1、HDFS 是什么

HDFS(Hadoop Distributed File System )Hadoop 分布式文件系统。由论文为GFS(Google File System)Google 文件系统启发,是Google GFS 的开源Java 实现。


2、HDFS 组件角色

    2.1  NameNode

  • HDFS 元数据管理者,管理NameSpace(文件系统命名空间),记录文件是如何分割成数据块以及他们分别存储在集群中的哪些数据节点上。
  • NameSpace 或其本身属性的任何更改都由NameNode 记录,维护整个文件系统的文件和目录。

   2.2  DataNode

  • DataNode 是文件系统的工作节点。根据客户端或者NameNode 发送的管理指令,负责HDFS 的数据块的读写和检索操作。
  • 通过心跳机制定期向NameNode 发送他们的存储块的列表。.

   2.3  Client

  • 客户端Client 代表用户与NameNode 或者DataNode 交互来访问整个文件系统的对象。
  • 开发人员面向Client API 来编程实现,对NameNode、DataNode 来说透明无感。

3、HDFS 架构设计

    3.1 基本架构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值