hdfs的切分策略

最新推荐文章于 2024-10-19 20:54:42 发布

山海自有归期

最新推荐文章于 2024-10-19 20:54:42 发布

阅读量952

点赞数 1

分类专栏：大数据文章标签： hdfs hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50691399/article/details/121887638

版权

大数据专栏收录该内容

12 篇文章

订阅专栏

本文详细介绍了HDFS（Hadoop Distributed File System）的分布式存储切分机制，包括128M的默认切分条件和10%的溢出机制，以及如何通过block ID识别相关块。数据切分后，存储位置根据节点资源动态分配，并由NameNode保存元数据信息，DataNodes实际存储数据。即使HDFS服务关闭，元数据也会持久化到磁盘，确保数据安全。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一：分布式存储切分机制

二：怎么识别切分后哪几个block块是一起的

三：切分后存储位置

四：数据放到hdfs时会进行block切分无论大小

五：切分块信息的存储

一：分布式存储切分机制

1：128M切分条件

2：溢出机制 10% （128+128*10%）

防止浪费资源避免小文件过多

例如：132 大于128但是没有大于140所以不会切分

145 大于128 且大于140 所以切分两个块一个是128 一个是17

二：怎么识别切分后哪几个block块是一起的

id是block连接的标识（保存在namenode中）

三：切分后存储位置

切分后存储在哪个节点是不固定的。根据每个节点所存储的文件和资源来存储

存储位置随机，当节点资源足够时根据资源谁资源大存储在谁那里

四：数据放到hdfs时会进行block切分无论大小

block切分过程是默认的

切分时会产生切分信息切分块数

master是用来保存切分信息 node1和node2来存储数据

在元数据上修改不会影响数据不会改变 hdfs上的数据不能直接修改

五：切分块信息的存储

namenode是主节点元数据信息

datanode是存储block块存储数据数据节点

元数据：针对与hdfs的操作

hdfs的目录结构在内存中

管理hdfs的目录在内存中

hdfs的服务关了，内存中的数据会丢失，为了避免数据丢失会把内存中的数据保存在磁盘中

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。