初识大数据BigData(笔记2)

最新推荐文章于 2021-05-22 22:00:04 发布

HPeak

最新推荐文章于 2021-05-22 22:00:04 发布

阅读量319

点赞数

分类专栏：笔记大数据文章标签： hadoop

本文链接：https://blog.csdn.net/scarecrow_faith/article/details/89342452

版权

7 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

文件系统结构：
在这里插入图片描述

1.不适合低延迟数据访问
2. 无法高效存储大量小文件
3. 不支持多用户写入及任意修改文件

名称节点（Namenode）
其中名称节点包括FsImage（保存系统文件树）和EditLog（记录对数据进行的诸如创建、删除、重命名等操作）。
FsImage存储的元数据包括文件的复制等级、修改时间和访问时间、访问权限、块大小以及组成文件的块。另外，第二名称节点（SecondaryNamenode）的作用是作为名称节点（Namenode）的冷备份和对EditLog不断增大问题的处理。
数据节点（DataNode），负责具体数据的存储。
HDFS命名空间：包括目录、文件和块。
HDFS的通信协议如下图：

HDFS 1.0 版本的局限性：
命名空间限制：名称节点是保存在内存中的，因此，名称节点能够容纳的对象（文件、块）的个数会受到空间大小的限制。
性能的瓶颈：整个分布式文件的吞吐量，受限于单个名称节点的吞吐量。
隔离问题：由于集群中只有一个名称节点，只有一个命名空间，因此无法对不同应用程序进行隔离。
集群的可用性：一旦这个唯一的名称节点发生故障，会导致整个集群变得不可用。

这些局限性在HDFS 2.0中都得到了解决，HDFS 2.0中设置了两个名称节点而且还设置成热备份。