Hadoop-HDFS

本文介绍了Hadoop分布式文件系统HDFS的架构,包括NameNode和DataNode的角色,以及数据备份策略。HDFS采用master/slave结构,NameNode负责文件系统命名空间管理和数据访问控制,DataNode则存储数据并执行NameNode的指令。数据备份通过replication实现,通常设置为3份,分布在不同机架。通信协议主要涉及ClientProtocol和DataNode Protocol,所有通信基于TCP。HDFS提供FileSystem Java API和命令行工具进行文件操作。
摘要由CSDN通过智能技术生成

对于框架/工具来说,最好的学习和参考来源还是官网。

链接:https://hadoop.apache.org/docs/r3.2.0/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#Introduction

HDFS:Hadoop 分布式文件系统,用于为有大量数据集的application提供高速数据访问,将数据以高容错的方式部署在众多廉价机器组成的集群上。

HDFS架构

HDFS的架构为 master/slave 结构(architecture),master以NameNode表示,slave以DataNode表示。

NameNode

NameNode是一个主服务器(master server),用于管理文件系统空间( file system namespace)与客户端(client)对这些文件的访问。

DataNode

DataNode是从属节点,通常集群上的一台机器为一个节点,属于slave的为DataNode,用于管理分配到该节点上的数据。

HDFS对外暴露一个文件系统空间,让使用者以文件的形式存储数据,一个文件会被分割成多个块(block)存储在不同的DataNode,而NameNode用于管理和操作这个文件系统空间,执行诸如读写文件这样的操作,同时NameNode也管理block如何分配到DataNode。NameNode响应cli

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值