HDFS详细介绍

    HDFS:(Hadoop Distributed File System)分布式文件系统,提供高吞吐量的应用程序数据访问,对外部客户机而言,HDFS 就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。但是 HDFS 的架构是基于一组特定的节点构建的,这是由它自身的特点决定的。这些节点包括 NameNode(仅一个),它在 HDFS 内部提供元数据服务;DataNode,它为 HDFS 提供存储块。由于仅存在一个 NameNode,因此这是 HDFS 的一个缺点(单点失败)。

    存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。这与传统的 RAID 架构大不相同。块的大小(通常为 64MB)和复制的块数量在创建文件时由客户机决定。NameNode 可以控制所有文件操作。HDFS 内部的所有通信都基于标准的 TCP/IP 协议。

    HDFS基本概念介绍

    1、Block:HDFS默认的基本存储单位是64M的数据块,和普通文件系统相同的是,HDFS中的文件是被分成64M一块的数据块存储的。 不同于普通文件系统的是,HDFS中,如果一个文件小于一个数据块的大小,并不占用整个数据块存储空间。

    2、元数据节点(NameNode)和数据节点(DataNode)

    元数据节点保存内容:

        a、主要用来管理文件系统的命名空间,其将所有的文件和文件夹的元数据保存在一个文件系统树中。 这些信息也会在硬盘上保存成以下文件:命名空间镜像(namespace image)及修改日志(edit log)

        b、其还保存了一个文件包括哪些数据块,分布在哪些数据节点上。然而这些信息并不存储在硬盘上,而是在系统启动的时候从数据节点收集而成的。

    数据节点保存内容

        真正存储数据的地方。客户端(client)或者元数据信息(namenode)可以向数据节点请求写入或者读出数据块。 其周期性的向元数据节点回报其存储的数据块信息。

    3、从元数据节点(secondary namenode)

    从元数据节点并不是元数据节点出现问题时候的备用节点,它和元数据节点负责不同的事情。 其主要功能就是周期性将元数据节点的命名空间镜像文件和修改日志合并,以防日志文件过大。这点在下面会相信叙述。 合并过后的命名空间镜像文件也在从元数据节点保存了一份,以防元数据节点失败的时候,可以恢复。

HDFS的Web页面提供了一种方便的方式来管理和监控Hadoop分布式文件系统。通过在浏览器中输入http://node01:50070(其中node01是NameNode所在的节点或IP地址),您可以登录HDFSWeb浏览器。 在登录后,您可以使用不同的选项来查看和管理HDFS的各个方面。其中一些选项包括: 1. datanodes:显示所有datanode节点的信息,这对于了解数据节点的状态和健康程度非常有用。 2. Datanode Volume Failures:显示失败的数据节点卷的信息,这对于排查和解决数据节点故障非常有帮助。 3. snapshot:显示HDFS文件系统的快照信息,这对于查看和管理文件系统的历史状态非常重要。 4. startupprogress:显示HDFS启动过程的详细信息,这对于监控和调试HDFS的启动过程非常有帮助。 5. Utilities Browse the file system:显示HDFS文件目录结构以及文件的详细信息,这对于浏览和查找特定文件非常有用。 此外,Web页面还提供了关于NameNode的存储路径的信息。NameNode存储数据的路径为/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/dfs/nn/edits,而存储fsimage的路径为/export/servers/hadoop-2.6.0-cdh5.14.0/hadoopDatas/namenodeDatas。这些路径对于了解和管理NameNode存储的数据非常重要。 总之,HDFS的Web页面提供了一个方便的界面来管理和监控Hadoop分布式文件系统,您可以通过该页面查看节点信息、故障信息、快照信息,并浏览和管理文件系统的内容。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [HDFS-web界面介绍](https://blog.csdn.net/qq_45769990/article/details/109146764)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [hadoophdfs与yarn界面功能介绍](https://blog.csdn.net/qq_32641659/article/details/87912452)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值