HDFS的基本概念

最新推荐文章于 2023-05-05 17:39:08 发布

是一只萨摩耶

最新推荐文章于 2023-05-05 17:39:08 发布

阅读量2.2k

点赞数

文章标签： hadoop hdfs 大数据

本文链接：https://blog.csdn.net/Aa112233aA1/article/details/117447967

版权

HDFS（Hadoop Distributed Filesystem）是一个易于扩展的分布式文件系统，运行在成百上千台低成本的机器上。它与现有的分布式文件系统有许多相似之处，都是用来存储数据的系统工具，而区别于HDFS具有高度容错能力，旨在部署在低成本机器上。HDFS提供对应用程序数据的高吞吐量访问，主要用于对海量文件信息进行存储和管理，也就是解决大数据文件（如TB乃至PB级）的存储问题。本节将针对HDFS的基本概念进行详细讲解。

1．NameNode(名称节点)

NameNode是HDFS集群的主服务器，通常称为名称节点或者主节点。一旦NameNode关闭，就无法访问Hadoop集群。NameNode主要以元数据的形式进行管理和存储，用于维护文件系统名称并管理客户端对文件的访问；NameNode记录对文件系统名称空间或其属性的任何更改操作；HDFS负责整个数据集群的管理，并且在配置文件中可以设置备份数量，这些信息都由NameNode存储。

2．DataNode（数据节点）

DataNode是HDFS集群中的从服务器，通常称为数据节点。文件系统存储文件的方式是将文件切分成多个数据块，这些数据块实际上是存储在DataNode节点中的，因此DataNode机器需要配置大量磁盘空间。它与NameNode保持不断的通信，DataNode在客户端或者NameNode的调度下，存储并检索数据块，对数据块进行创建、删除等操作，并且定期向NameNode发送所存储的数据块列表，每当DataNode启动时，它将自己负责持有的数据块列表发送到NameNode机器中。

3．Block（数据块）

每个磁盘都有默认的数据块大小࿰

最低0.47元/天解锁文章

是一只萨摩耶

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
HDFS的基本概念

HDFS（Hadoop Distributed Filesystem）是一个易于扩展的分布式文件系统，运行在成百上千台低成本的机器上。它与现有的分布式文件系统有许多相似之处，都是用来存储数据的系统工具，而区别于HDFS具有高度容错能力，旨在部署在低成本机器上。HDFS提供对应用程序数据的高吞吐量访问，主要用于对海量文件信息进行存储和管理，也就是解决大数据文件（如TB乃至PB级）的存储问题。本节将针对HDFS的基本概念进行详细讲解。1．NameNode(名称节点)NameNode是HDFS集群的主服务器，
复制链接

扫一扫