HDFS知识点

最新推荐文章于 2022-07-06 12:26:29 发布

yunqiublog

最新推荐文章于 2022-07-06 12:26:29 发布

阅读量282

点赞数

分类专栏： hadoop HDFS 文章标签： HDFS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/changemyall/article/details/87105281

版权

本文总结了HDFS的工作机制，包括文件切块、数据存储、NameNode和DataNode的角色、元数据管理以及Secondary NameNode的功能。还详细介绍了HDFS的写入和读取流程，强调了NameNode的元数据存储策略以及Secondary NameNode在故障恢复中的作用。

摘要由CSDN通过智能技术生成

HDFS最近学习总结

一. hdfs整体运行机制：

客户把一个文件存入HDFS中，其实HDFS会把文件切成块进行存储，会分散存储到N台Linux系统中（存储文件块的角色是:datanode）(重要的是切块的行为是由客户端决定的)
一旦文件被切块切块存储，HDFS一定要有个机制，需要记录每一个文件的切块信息和每个切块具体的存储机器。（记录块信息的是namenode）
需要保证数据的安全性，HDFS将每一个块都在集群中存放多个副本（副本数是由存储时的客户端决定的）。
总结 : 一个HDFS系统是由一台运行了namenode的服务器和N台运行了datanode的服务器组成。

5.概述

HDFS集群分为两大角色：NameNode、DataNode (Secondary Namenode)
NameNode负责管理整个文件系统的元数据
DataNode 负责管理用户的文件数据块
文件会按照固定的大小（blocksize）切成若干块后分布式存储在若干台datanode上
每一个文件块可以有多个副本，并存放在不同的datanode上
Datanode会定期向Namenode汇报自身所保存的文件block信息，而namenode则会负责保持文件的副本数量
HDFS的内部工作机制对客户端保持透明，客户端请求访问HDFS都是通过向namenode申请来进行

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。