hadoop---hdfs

最新推荐文章于 2022-04-04 15:00:53 发布

beginning1126

最新推荐文章于 2022-04-04 15:00:53 发布

阅读量594

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/beginning1126/article/details/52847695

版权

2 篇文章 0 订阅

订阅专栏

hdfs

类似于unix文件系统，hdfs也有block的概念，默认是128MB，但是和unix文件系统不同的是，1个1MB的文件，不会占用一个block的全部大小，仍然只占用1MB空间。

block的用途：

Namenode：

HDFS文件系统中的文件目录树，以及文件的数据块索引，即每个文件对应的数据块列表。目录树、元数据和数据块的索引信息会持久化到物理存储中，实现是保存在命名空间的镜像fsimage和编辑日志edits中。
数据块和数据节点的对应关系，即某一块数据块保存在哪些数据节点的信息。存储在内存中，由NameNode启动后DataNode主动上报它所存储的数据块，动态建立对应关系。

Datanode：

secondary namenode：

hadoop2.x方案，两个namenode，active-standby模式

共享存储，保存edit log，当主namenode挂掉，备份namenode变为active，从共享存储中读取edit log，构建namespace image，并读入内存。共享内存选择（NFS/QJM）
datanode将file-block-datanode映射关系同时发给上述两个namenode
client必须能以用户没有感知的情况下，在主备namenode之间切换

参考：http://blog.csdn.net/anzhsoft/article/details/23279027