HDFS写读文件

最新推荐文章于 2023-05-29 15:01:58 发布

King_1874

最新推荐文章于 2023-05-29 15:01:58 发布

阅读量179

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/King_1874/article/details/81629674

版权

Hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一.HDFS - 写文件

1.客户端将文件写入本地磁盘临时目录中. 2,当文件达到一个block的大小时便向namenode发送写入请求. 3,.NameNode在HDFS的文件系统中创建一个文件，并把该block id和要写入的DataNode的列表返回给客户端. 4.客户端收到这些信息后，将临时文件写入DataNodes

Rack aware（机架感知）

通过配置文件指定机架名和DNS的对应关系

假设复制参数是3，在写入文件时，会在本地的机架保存一份数据，然后在另外一个机架内保存两份数据（同机架内的传输速度快，从而提高性能）

整个HDFS的集群，最好是负载平衡的，这样才能尽量利用集群的优势

二.HDFS - 读文件

客户端向NameNode发送读取请求
NameNod返回回文件的所有block和这些block所在的DataNodes（包括复制节点）
客户端直接从DataNode中读取数据，如果该DataNode读取失败（DataNode失效或校验码不对），则从复制节点中读取（如果读取的数据就在本机，则直接读取，否则通过网络读取）

三.Hadoop 可靠性

DataNode可以失效

DataNode会定时发送心跳到NameNode。如果一段时间内NameNode没有收到DataNode的心跳消息，则认为其失效。此时NameNode就会将该节点的数据（从该节点的复制节点中获取）复制到另外的DataNode中
数据可以毁坏

无论是写入时还是硬盘本身的问题，只要数据有问题（读取时通过校验码来检测），都可以通过其他的复制节点读取，同时还会再复制一份到健康的节点中
NameNode不可靠

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS写读文件

一.HDFS - 写文件 1.客户端将文件写入本地磁盘临时目录中. 2,当文件达到一个block的大小时便向...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。