167.Hadoop（三）：HDFS的shell操作，api的使用，读写流程，NN和2NN，DataNode

最新推荐文章于 2024-08-31 23:02:38 发布

鹏哥哥啊Aaaa

最新推荐文章于 2024-08-31 23:02:38 发布

阅读量130

点赞数

分类专栏：从头开始学编程文章标签： hdfs hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40594696/article/details/125012252

版权

从头开始学编程专栏收录该内容

202 篇文章 3 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

本文详细介绍了HDFS的基础概念，包括HDFS的定义、使用场景、优缺点及组成架构。重点讲解了NameNode和DataNode的角色，以及Secondary NameNode的工作原理。此外，还探讨了HDFS的文件块大小设置和HDFS的shell及API操作。HDFS的读写流程、NameNode与2NN的工作流程、DataNode的工作机制也是文章的重点内容。

摘要由CSDN通过智能技术生成

目录

一、HDFS基础概念

1.什么是HDFS

2.HDFS使用场景

6.HDFS组成架构

（1）NameNode：可以理解成master

（2）DataNode：可以理解成slave

（3）Client：客户端

（4）Secondary NameNode：SNN不是NameNode的热备，即NameNode挂了SNN不会去替代它

7.HDFS文件块大小设置

（1）为什么默认是128M

（2）为什么块不能太小

（3）为什么块不能太大

二、HDFS的shell操作（重要）

1.上传+追加

三、HDFS的API操作

1.将配置文件配置到环境变量

2.idea创建一个项目，并导入依赖

4.编写代码，并测试

5.其他功能编写

四、HDFS的读写流程

1.HDFS写数据流程（面试重点）

2.节点距离计算

3. 副本节点选择

4.HDFS读数据的流程

五、 NameNode和SecondaryNameNode

1.NN和2NN的工作流程

2.fsimage和edits概念

3.查看fsimage和edits操作

（1）查看fsimage相关操作

（2）查看edits相关操作

4.checkPoint时间设置

六、DataNode的工作机制

1.DataNode运行流程

2.DataNode目录查看，手动设置同步块信息时长

3.数据完整性校验

4.掉线时限参数设置

一、HDFS基础概念

1.什么是HDFS

HDFS它是一个文件系统，用于存储文件，通过目录树来定位文件（类比linux文件系统结构）。

其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。

2.HDFS使用场景

适合一次写入，多次读出的场景。一个文件经过创建、写入和关闭之后就不需要改变

3.HDFS优点

（1）高容错性，因为分布式，数据会有多个副本</

了解本专栏

超级会员免费看

鹏哥哥啊Aaaa

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
167.Hadoop（三）：HDFS的shell操作，api的使用，读写流程，NN和2NN，DataNode

HDFS的shell操作，api的使用，读写流程，NN和2NN，DataNode
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

鹏哥哥啊Aaaa 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。