大数据课程-HDFS详解

1、 Hadoop的历史

  • 作者Doug Cutting

  • Lucene

  • 三驾马车

    GFS
    MapReduce
    BigTable

  • hadoop生态圈

    hdfs
    mapreduce
    yarn
    common

2、HDFS的存储原理

各个角色的作用
  • NameNode

    1、接受客户端的读写请求

    2、管理元数据

       ①上传的文件的权限

       ②上传文件的属主以及属组

       ③上传文件的时间

       ④上传文件的block数以及ID号

       ⑤每一个Block的位置信息是由DN在集群启动之时汇报的 不会持久化

       ⑥各个DN位置信息

    3、管理DN

  • DataNode

    1、接受客户端的读请求

    2、存储block块

    3、向active NN汇报心跳

    4、构建pipeline

    5、管理本机上block元数据

  • SNN
负责持久化
  1. 拉取NN节点上的edits+fsimage文件 合并

    edits文件存储客户端对HDFS的操作

    为什么要搞edits来存储操作呢?

     因为如果不把操作存储在文件中,而是在内存中,在S

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值