Sgg：HDFS读写数据原理&&NameNodeDataNode

极度丶浚爱

于 2019-12-11 19:27:49 发布

阅读量236

点赞数

分类专栏： Hadoop 文章标签： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43123615/article/details/103497693

版权

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

HDFS读写数据原理

1 写数据原理
2 读数据原理
3 NameNode&DataNode

Hadoop distributed file system
Hadoop分布式文件系统

1 写数据原理

在这里插入图片描述

客户还client向namenode请求上传文件
namenode应答，可以上传
请求上传第一个block(HDFS中对数据的存储都是成块存在的，默认为128MB/block)，因此需要成块上传。
namenode返回存储数据的几个节点。
client请求datanode建立传输block的通道
datanode回复应答成功
开始传输数据。

2 读数据原理

在这里插入图片描述

客户端client向namnode请求下载文件
namenode返回元数据
客户端client拿到元数据开始找元数据所在的节点
根据每个节点请求读取数据
然后传输数据

3 NameNode&DataNode

3.1NameNode&SecondaryNameNode

3.1.1作用

NameNode:
在这里插入图片描述

存储文件的元数据。（文件名、文件目录结构、文件属性）
每个文件块所在的DataNode

SecondaryNameNode：
在这里插入图片描述
不是NameNode的备份！！

监控整个HDFS的集群运行
每隔一段时间获取NameNode的快照，帮助它合并文件。

3.1.2工作机制

在这里插入图片描述
第一阶段

hdfs第一次启动需要格式化NameNode，创建edits和Fsimage文件。如果不是第一次启动，则直接加载edits文件和Fsimage文件到内存。
客户端请求对元数据进行增删查改。
NameNode记录操作日志，更新滚动日志。
NameNode进行增删改查。

第二阶段

SecondaryNameNode每隔一段时间询问NameNode是否需要checkpoint。
SecondaryNameNode向NameNode请求checkpoint。
NameNode滚动文件日志edits
拷贝edits文件和fsimage文件到SecondaryNameNode，将二者加载到内存，并合并。
生成新的fsimage文件：fsimage.chkpoint。
拷贝fsimage.chkpoint文件到NameNode。
NameNode将fsimage.chkpoint重新命名为fsimage。

3.2 DataNode

3.2.1 作用

在这里插入图片描述
存储数据文件、数据块的校验和。

3.2.2 原理

在这里插入图片描述

DataNode启动后向NameNode注册。
NameNode返回注册成功。
心跳机制：
每隔三秒DataNode向NameNode传递一次心跳，伴随NameNode对DataNode的命令
如果超过10分钟DataNode不向NameNode传递信息，则认为这个节点不可用。已挂。

极度丶浚爱

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Sgg：HDFS读写数据原理&&NameNodeDataNode

HDFS读写数据原理1 写数据原理2 读数据原理3 NameNode&DataNode3.1NameNode&SecondaryNameNode3.1.1作用3.1.2工作机制3.2 DataNode3.2.1 作用3.2.2 原理Hadoop distributed file systemHadoop分布式文件系统1 写数据原理客户还client向namenode请求...
复制链接

扫一扫

专栏目录

极度丶浚爱

博客等级

码龄6年

70
原创

63
点赞

127
收藏

52
粉丝

关注

私信

热门文章

分类专栏

Spark 5篇
数仓 2篇
Kafka 1篇
面经 3篇
Flink 1篇
Scala 24篇
SQL 2篇
深度学习 1篇
MySQL 3篇
算法 8篇
计算机网络 2篇
Hadoop 2篇
IDEA 2篇
JavaSE 11篇

最新评论

复习kafka
CSDN-Ada助手: 推荐云原生入门技能树：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
spark基本原理&UI界面解读
征途黯然.: This article about spark基本原理UI界面解读 is very insightful and profound! The understanding and explanation are impressive. I have gained a lot of knowledge from it. Thank you for sharing!
Sgg：Hadoop Shuffle机制
想开悟的大学生: 楼主写的真好，点赞
Sgg:知乎数据仓库实习面试
极度丶浚爱: 过了，没去
Sgg:知乎数据仓库实习面试
极度丶浚爱: 活了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。