Hadoop 数据存储之NameNode、DataNode

最新推荐文章于 2025-03-21 11:07:56 发布

原创最新推荐文章于 2025-03-21 11:07:56 发布

· 1.6k 阅读

·

1

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#hadoop #1024程序员节 #hdfs

Hadoop 管理与调优专栏收录该内容

1 篇文章

订阅专栏

NameNode的功能：

NameNode通过执行以下任务来管理文件系统命名空间。

维护与文件系统相关的元数据，如文件层次结构和每个文件的块位置；
管理用户对数据文件的访问；
数据块和集群中存储节点的映射关系；
执行对文件系统的操作，如打开或关闭文件以及目录；
为集群中的DataNode成员提供注册服务并处理来自DataNode的周期性心跳；
确定哪些节点上的数据应该被复制，并删除超出的复制块；
处理DataNode发送的块报告并维护数据库的存放位置。

虽然Namenode知道HDFS块的所对应的DataNode节点信息，但是它不会直接存储块对应的位置，它只是根据在启动集群时datanode发送的信息来重构，之后将信息保存在内存中，用于快速访问。

来看看NameNode在hadoop集群中的作用，重点是metadata hdfs元数据的管理。如果单节点的namenode挂掉的话，试想hadoop集群还能启动的起来吗？

单节点的namenode宕机后，集群是不能正常启动的，更不会对外正常提供服务了。这让namenode显得尤为重要，所以namenode节点一般会有2个，一个namenode，第二个 namenode主要为活跃的namenode做 standby 的。

DataNode 的功能：

DataNode 根据NameNode发送的指令执行以下功能：

通过在本地文件系统上存储数据块提供存储功能；
完成客户端对DataNodes上存储的数据的读写请求；
创建和删除数据块；
在集群中复制数据；
通过定期发送块报告和心跳来保持与NameNode的联系。心跳确认DataNode是活的和健康的，块报告显示由DataNode管理的块信息。

博客等级

码龄18年

95
原创

25
点赞

71
收藏

1014
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: Mysql数据库表用户创建及表授权

下一篇：: Maven私服上传第三方Jar包操作

最新评论

springboot项目在spark yarn 集群上部署运行
b u g: spark-submit --class 启动springboot启动类后，spark任务运行完成main的内容就完了。有什么办法解决吗
springboot项目在spark yarn 集群上部署运行
manbufenglin: run 方法下加入日志或设置断点，试试
springboot项目在spark yarn 集群上部署运行
DataCareer: D:\SourceCode\spark-merge>spark-submit --class com.afanti.SparkApplication --master local --deploy-mode client target/spark-merge-1.0-SNAPSHOT-jar-with-dependencies.jar DouyinAwemeInfoMerge "2022-02-09 00:00:00" 1 abc [DouyinAwemeInfoMerge, 2022-02-09 00:00:00, 1] log4j:WARN No appenders could be found for logger (org.springframework.core.env.StandardEnvironment). log4j:WARN Please initialize the log4j system properly. log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info. . ____ _ __ _ _ /\\ / ___'_ __ _ _(_)_ __ __ _ \ \ \ \ ( ( )\___ | '_ | '_| | '_ \/ _` | \ \ \ \ \\/ ___)| |_)| | | | | || (_| | ) ) ) ) ' |____| .__|_| |_|_| |_\__, | / / / / =========|_|==============|___/=/_/_/_/ :: Spring Boot :: (v1.0-SNAPSHOT)
springboot项目在spark yarn 集群上部署运行
DataCareer: 我的使用spark-submit运行时不执行CommandLineRunner子类的run方法。
Hadoop与Hbase 版本兼容（官网）
唔昂么萤衣唔俺: 就是说hbase官方说的现有版本都不支持hadoop3.2以上是么？

大家在看

Python小游戏（猜数字） 261

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。