Hadoop之分布式文件存储系统Hdfs

简单了解一下Hadoop的Hdfs(分布式文件存储系统)

1、Hdfs将一个很大的数据分割成很多小的数据块(Blocks)存储在数据节点(DataNode)上,由NameNode进行管理
2、提供副本进行容错及可靠性保证,每个数据默认在两个不通机架的三个节点上保存由三个副本
3、HDFS是针对MapReduce设计的,使得数据尽可能根据其本地局部性进行访问与计算。
5、提供对这些信息的快速访问,并提供可扩展的方式。能够通过简单加入更多服务器的方式就能够服务更多的
在这里插入图片描述
NameNode
文件信息在硬盘上保存成两个文件:命名空间镜像文件(fsimage)和修改日志文件(edit log)。此外,NameNode还保存一个文件,用来存储数据块在数据节点的分布情况。系统启动之时,这些信息会加载到内存中。
1.存储文件元数据,比如整棵树的目录结构,运行时所有数据都保存到内存,整个HDFS可存储的文件数受限于NameNode的内存大小
2.运行NameNode的服务器至关重要,只有1个,一旦失效则整个文件系统失效
3.只对元数据的增删做日志记录,不对block和文件流做记录。
4.DataNode故障时,负责创建更多的副本block5、数据会定时保存到本地磁盘,但不保存block的位置信息,而

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值