大数据组件学习4 —— HDFS(一)

本文详细介绍了Hadoop的分布式文件系统HDFS,包括NameNode、SecondaryNameNode和DataNode的角色和功能。HDFS适用于大规模数据存储,以支持大数据分析。文章还阐述了NN、2NN和DN的工作机制,如元数据管理、镜像备份和数据节点心跳机制。
摘要由CSDN通过智能技术生成

Hadoop生态系统包含众多框架,从Hadoop框架本身开始,Hadoop本身包含三个组件 HDFS, Yarn, MapReduce,分别对应海量数据存储,资源调度,海量数据计算。 (讨论的是Hadoop 2.X,Yarn代替了1.X的 JobTracker)

一、HDFS, 又称 分布式文件系统,为适应海量数据的存储问题而设计,主要包含三个部分 NameNode, SecondaryNameNode, DataNode

1.1 NameNode(NN)

NN管理元数据信息,以及每一个文件对应的块信息

2.1 SecondaryNameNode(2NN)

  2NN是后台运行的程序,辅助NN管理元数据

3.1 DataNode(DN)

  DN用于实际管理文件数据块,存有数据块的副本

NN DN
存储元数据(目录结构与文件分块位置信息) 存储文件内容(Block)
存在内存 存在磁盘
保存Block, DN, 文件之间的映射关系 保存Block id, DN 本地文件之间的映射关系

小结:NN与DN形成Master/Slaver主从架构,NN是主节点,DN是从节点,协调运行形成分布式文件系统。HDFS适用于 “一次写入,多次读取” 的场景,即大数据分析场景下的底层数据存储,而不是网盘这类应用,因为修改不便,延迟大&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值