独家 | 带你认识HDFS和如何创建3个节点HDFS集群(附代码&案例)

本文介绍了HDFS的基础知识,包括架构、NameNode和DataNode的角色、备用NameNode的作用,以及如何使用Docker搭建3节点的HDFS集群。通过实践步骤,读者将学习如何配置和管理HDFS集群。
摘要由CSDN通过智能技术生成

640?wx_fmt=png

作者:尼廷·兰詹(Nitin Ranjan)

翻译:陈之炎

校对:王威力

本文约1500字,建议阅读5分钟。

在本文中,大数据专家将为您介绍如何使用HDFS以及如何利用HDFS创建HDFS集群节点。


我们将从HDFS、Zookeeper、Hbase和OpenTSDB上的系列博客开始,了解如何利用这些服务设置OpenTSDB集群。在本文中,我们将探究HDFS。


HDFS


Hadoop分布式文件系统(HDFS)是一种基于Java的分布式文件系统,它具有容错性、可伸缩性和易扩展性等优点,它可在商用硬件上运行,也可以在低成本的硬件上进行部署。HDFS是一个分布式存储的Hadoop应用程序,它提供了更易访问数据的接口。


架构


HDFS架构包含一个NameNode、DataNode和备用NameNode。

HDFS具有主/从架构。


640?wx_fmt=png


NameNode:HDFS集群包含单个NameNode(主服务器),它管理文件系统命名空间并控制客户端对文件的访问权限。它维护和管理文件系统元数据;例如由哪些块构成文件,以及存储这些块的数据节点。


DataNode:可以有多个DataNode,通常是集群中每个节点有一个DataNode,它负责管理运行节点的存储访问。HDFS中的DataNode存储实际数据,可以添加更多的DataNode来增加可用空间。


备用NameNode :备用NameNode服务并非真正的备用NameNode,尽管名称是称为备用NameNode。具体来说,它并不为NameNode提供高可用性(HA)。


为什么需要备用NameNode?


备用NameNode记录文件系统的修改痕迹,追加到本机文件系统文件的后面,作为修改日志。


  • 启动备用NameNode时,它会从映像文件fsimage中读取H

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值