Hadoop 组件之 HDFS

1、HDFS 是什么
HDFS(Hadoop Distributed File System )Hadoop 分布式文件系统。由论文为GFS(Google File System)Google 文件系统启发,是Google GFS 的开源Java 实现。

2、HDFS 组件角色
    2.1  NameNode

HDFS 元数据管理者,管理NameSpace(文件系统命名空间),记录文件是如何分割成数据块以及他们分别存储在集群中的哪些数据节点上。
NameSpace 或其本身属性的任何更改都由NameNode 记录,维护整个文件系统的文件和目录。
   2.2  DataNode

DataNode 是文件系统的工作节点。根据客户端或者NameNode 发送的管理指令,负责HDFS 的数据块的读写和检索操作。
通过心跳机制定期向NameNode 发送他们的存储块的列表。.
   2.3  Client

 客户端Client 代表用户与NameNode 或者DataNode 交互来访问整个文件系统的对象。
 开发人员面向Client API 来编程实现,对NameNode、DataNode 来说透明无感。
3、HDFS 架构设计
    3.1 基本架构

HDFS 是一个主从式(Master/Slave)的体系结构。HDFS 集群中有一个NameNode 和一些DataNodes,NameNode 管理文件的元数据,DataNode 存储实际的数据。从用户的角度看,就像操作传统的文件系统一样,可以通过目录路径对文件执行创建、读取、删除操作。客户端联系NameNode 来获取元数据信息,而真正的文件I/O 是直接和DataNode 进行交互的。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值