Hadoop基础之HDFS

Hadoop基础之HDFS

      HDFShadoop的分布式文件系统,是一个高度容错性的系统(做了冗余),适合部署在廉价的机器上。可以提供高吞吐量的数据访问,适合大规模数据集上的应用。

      简单结构:DateNode+NameNode

      设计思路:个人理解,首先从宏观来说,DN做集群,数据做冗余,这样使得hdfs的容错性增加,NN的设计有点类似jvm中的栈,以及Dubbo的注册中心,用于存放真正数据或者说组件和存放组件的详细信息(元数据)分离,这样数据请求要先在NN中找到自己想要的组数据信息(存在哪个DN?哪个Block?等)但是NN不转发请求,这样就减少了NN的压力,这种设计让整个框架变得更加灵活。有点像IOCxml配置,想要动态增加组件,只需要分别增加组件实体和元数据即可。

      整体框架:

      Block作为hdfs的数据存储单元,每个文件按照大小切分成若干个Block,存储在不同节点上,默认情况下每个block都有三个副本,存放在不同的DN上。

      NameNode接收客户端的读写服务,保存DN以及Block的详细信息。

      DateNode存储block,并且在启动的时候向NN汇报block信息,通过向NN发送心跳保持与其联系,如果NN10分钟没有收到DN的心跳,则认为DN已经死掉,并copy其上的block到其他DN上。  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值