分析 HADOOP-HDFS文件储存机制

最新推荐文章于 2024-04-27 06:00:00 发布

码虫码农

最新推荐文章于 2024-04-27 06:00:00 发布

阅读量1.2k

点赞数

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a6686039/article/details/106034061

版权

hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

大家看到 hadoop-2.6.0-cdh5.15.1.tar.gz 压缩包是400M有余

我们直接用hadoop fs -put 命令，把包存进HDFS文件系统。

我这边的版本 block size的默认大小是128M

所以，就是这个文件会分为4个block.

用视图工具看了下，确实是分了4个Block.

然后我们在自定义的HDFS存放数据的根目录/dfs/data/current/BP-504131312-192.168.1.201-1587715632917/current/finalized/subdir0/subdir0 找到datanode 存放数据的地方

可以看到 4个 block 。也就是说 HDFS把文件切割成 4个block，前三个block的大小都是一样的。

我们这里按顺序把4个文件拼接起来用 cat blk_1073741830 >> demo.tar.zip 。拼接完后，是可以解压的。如果不按顺序拼接，出来的接口是不能解压。

所以我们可以知道：HDFS文件系统存储的机制是将文件按顺序切割。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分析 HADOOP-HDFS文件储存机制

大家看到hadoop-2.6.0-cdh5.15.1.tar.gz 压缩包是400M有余我们直接用hadoop fs -put 命令，把包存进HDFS文件系统。我这边的版本block size的默认大小是128M所以，就是这个文件会分为4个block.用视图工具看了下，确实是分了4个Block.然后我们在自定义的HDFS存放数据的根目录/dfs/data/current/BP-504131312-192.168.1.201-1587715632917/c...
复制链接

扫一扫

专栏目录

码虫码农 CSDN认证博客专家 CSDN认证企业博客

码龄10年

57: 原创

8万+: 周排名

191万+: 总排名

6万+: 访问

: 等级

1216: 积分

10: 粉丝

27: 获赞

18: 评论

89: 收藏

私信

关注

热门文章

分类专栏

java 11篇
hadoop 5篇
公司财报
kafka 2篇
Java虚拟机 4篇
线程池 1篇
MongoDB 1篇
python基础
java并发编程 3篇
工具 2篇
tomcat 2篇
spring 4篇
nginx 1篇
mysql 4篇
java容器 2篇
redis 5篇
maven 2篇
springcloud 5篇
springboot 1篇
微服务 2篇
消息队列 3篇
事务 1篇

最新评论

简单理解聚集索引和非聚集索引
咖喱喱: 非聚集索引的概念都搞错了吧，非聚集索引不是普通索引/辅助索引/二级索引非聚集索引指的是，索引和数据分开，无论是主键索引（一级索引）还是二级索引，索引的叶子节点都存的是指向数据的指针，并没有什么二级索引查出主键，再“回表”查数据的过程多吐槽一句，和楼主无关哈：现在网上的技术帖子质量太参差不齐了！！！
关于部署项目到tomcat，报FAIL - Application at context path [/imageDownloader_war] could not be started
TatukGIS: geoserver 目前不支持 tomcat 10 版本，用 9 的版本即可。
adb 与夜神模拟器版本冲突问题
leptune99: 找了好久终于找到正确的解决方法了，万分感谢~~~
在intellij idea中将maven项目打包成jar包，导入另一个项目使用
CPS1016347441: 我的maven工程按照你说的步骤没有生成jar包也没有报错，你的这个操作有没有其他前提？我的工程本地clean test 都是正常的。
对象的访问定位
ctotalk: mark

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。