HDFS的基本概念

最新推荐文章于 2023-05-05 17:39:08 发布

limn2o4

最新推荐文章于 2023-05-05 17:39:08 发布

阅读量350

点赞数

分类专栏： Hadoop and Spark

本文链接：https://blog.csdn.net/lingzidong/article/details/86527256

版权

6 篇文章 0 订阅

订阅专栏

当一台计算机无法存储海量数据时，就对他进行分区，分开在若干台计算机上。然而普通的文件系统无法胜任这一工作，于是，分布式文件系统就应运而生。

1.数据块：
每个硬盘都有默认的数据块大小，大小不一。他们是磁盘读写数据的最小单位。HDFS中有同样的概念，但是根据其海量数据的要求，一般一个块大小为 128 MB 。比磁盘的块要大得多。这样做的原因是为了将寻址（寻找块的过程）所需时间尽可能地变短。
使用块对文件系统进行抽象，有以下的好处

备份持久状态，将上面提到的信息在写入本地磁盘的时候，同时吸入远程挂载的网络文件系统上，
开启辅助 namenode ，这个节点定期合并主要节点的镜像和日志，这个节点一般和主 namenode 分开在不同的计算机上，因为合并操作比较耗时。我们在启动 HDFS 时总会看到 SecondaryNameNode 进程就是我们说的辅助节点了。