Hadoop学习笔记:HDFS理论知识

本文详细介绍了Hadoop的分布式文件系统HDFS,包括其架构、主要组件如NameNode、SecondaryNameNode和DataNode的角色和功能,以及HDFS体系结构的局限性,探讨了名称空间限制、性能瓶颈、隔离问题和集群可用性等问题。
摘要由CSDN通过智能技术生成

HDFS介绍

HDFS是hadoop自带的分布式文件系统,英文名为:Hadoop Distributed Filesystem,HDFS以流式数据访问模式来存储超大文件。

分布式文件系统的结构

分布式文件系统在物理结构上是由计算机集群中的多个节点构成的,这些节点分为两类,一类叫“主节点”(Master Node)或者也被称为“名称结点”(NameNode),另一类叫“从节点”(Slave Node)或者也被称为“数据节点”(DataNode)
在这里插入图片描述

HDFS主要组件的功能
NameNode DataNode
存储元数据 存储文件内容
元数据保存在内存中 文件内容保存在磁盘中
保存文件,block,datanode之间的映射关系 维护了block id到datanode本地文件爱的映射关系
名称节点(NameNode)
  • 在HDFS中,名称节点(NameNode)负责管理分布式文件系统的命名空(Namespace)保存了两个核心的数据结构,即FsImage和EditLog
    • FsIma
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值