大数据学习随笔2.(HDFS理论基础)

HDFS理论基础

  • 思考:为什么需要开发HDFS?

    • 思路:开发hdfs肯定是为了更好地去支持分布式存储和计算。
      • 1.hdfs对于分布式中的分而治之,并行计算的支持
      • 2.hdfs对于分布式中的计算向数据移动的支持。
  • 存储模型

    • 文件线性按字节切割成块(block),有offset,id
    • 不同文件的块大小可以不一样
    • 同一个文件除了最后一个块,其他的块大小一致
    • block的块大小依照硬件到I/O调整。hadoop2.x默认块大小为128MB
    • block分散在集群的节点上,有自己的location信息。
    • block有副本机制(replication),没有主从概念,副本存在不同的节点上。
    • 副本是为了满足数据可靠性和计算性能
    • 文件上传可以指定block大小和副本数,上传后只能修改副本数(增加副本数)
    • 文件支持追加数据,不支持修改数据
  • 架构设计

    • hdfs是一个主从架构(Master/Slaves)
    • 主要由NameNode和DataNode组成
    • hadoop2.x支持两种集群模式:非高可用和高可用(HA)
      • 非高可用:由一个SecondaryNameNode对NameNode进行数据备份更新FsImage和EditLog。
      • 高可用(HA):2.x支持一个Active和一个StandyBy的NameNode组成
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值