分布式文件系统HDFS—技术小结

将笔记中HDFS中部分学习总结记录于此,对HDFS进行粗浅的介绍。

提出问题:1.HDFS副本存放策略;2.大文件写入策略(切分blocks,三份备份);3.HDFS不适合存储小文件,为什么?(元数据存储在内存中,过多小文件带来大量元数据,导致namenode负载过大)

建议读GFS原版论文,多读读。

概述:

  1. 非常易于扩展
  2. 运行在大量廉价主机上,提供容错机制,适合网盘业务
  3. 为大量用户提供性能不错的文件存取业务

优点:

  1. 高容错性,多个副本保存数据
  2. 适合批处理,移动计算而非移动数据,数据位置暴露给计算框架
  3. 适合大数据存储处理,上万节点
  4. 流式文件访问,一次写入,多次读取。保证一致性,不可修改,若想修改只能去Yarn
  1. 廉价主机集群

缺点:

  1. 不适合低延迟,hadoop框架核心是用延迟换取IO吞吐率,毫秒级延迟做不到
  2. 不适合小文件存取,占用namenode大量内存,小文件会导致寻道时间超过读取时间
  1. 不支持并发写入、随机修改,一个文件只能有一个写入操作者,仅支持append追加,不能改已有数据,

只能把现有的追加后删除原有文件。真实环境中,此类应用场景占据80%,因此用途较广

架构和原理:

目前标准配置:3TB×12

考虑问题:文件备份,负

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值