独家 | 带你认识HDFS和如何创建3个节点HDFS集群（附代码&案例）

最新推荐文章于 2021-10-10 17:04:01 发布

数据派THU

最新推荐文章于 2021-10-10 17:04:01 发布

阅读量769

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/95126291

版权

本文介绍了HDFS的基础知识，包括架构、NameNode和DataNode的角色、备用NameNode的作用，以及如何使用Docker搭建3节点的HDFS集群。通过实践步骤，读者将学习如何配置和管理HDFS集群。

摘要由CSDN通过智能技术生成

640?wx_fmt=png

作者：尼廷·兰詹(Nitin Ranjan)

翻译：陈之炎

校对：王威力

本文约1500字，建议阅读5分钟。

在本文中，大数据专家将为您介绍如何使用HDFS以及如何利用HDFS创建HDFS集群节点。

我们将从HDFS、Zookeeper、Hbase和OpenTSDB上的系列博客开始，了解如何利用这些服务设置OpenTSDB集群。在本文中，我们将探究HDFS。

HDFS

Hadoop分布式文件系统(HDFS)是一种基于Java的分布式文件系统，它具有容错性、可伸缩性和易扩展性等优点，它可在商用硬件上运行，也可以在低成本的硬件上进行部署。HDFS是一个分布式存储的Hadoop应用程序，它提供了更易访问数据的接口。

架构

HDFS架构包含一个NameNode、DataNode和备用NameNode。

HDFS具有主/从架构。

640?wx_fmt=png

NameNode：HDFS集群包含单个NameNode（主服务器），它管理文件系统命名空间并控制客户端对文件的访问权限。它维护和管理文件系统元数据；例如由哪些块构成文件，以及存储这些块的数据节点。

DataNode：可以有多个DataNode，通常是集群中每个节点有一个DataNode，它负责管理运行节点的存储访问。HDFS中的DataNode存储实际数据，可以添加更多的DataNode来增加可用空间。

备用NameNode ：备用NameNode服务并非真正的备用NameNode，尽管名称是称为备用NameNode。具体来说，它并不为NameNode提供高可用性(HA)。

为什么需要备用NameNode？

备用NameNode记录文件系统的修改痕迹，追加到本机文件系统文件的后面，作为修改日志。

启动备用NameNode时，它会从映像文件fsimage中读取H

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
独家 | 带你认识HDFS和如何创建3个节点HDFS集群（附代码&案例）

作者：尼廷·兰詹(Nitin Ranjan)翻译：陈之炎校对：王威力本文约1500字，建议阅读5分钟。在本文中，大数据专家将为您介绍如何使用HDFS以及如何利用HDFS创...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。