【大数据Hadoop系列】 Hadoop-HDFS知识体系总结(2021版)

本文详细介绍了HDFS的使用场景、优缺点、组成架构,包括NameNode和SecondaryNameNode的角色,以及HDFS的数据流过程。此外,还讨论了HDFS的文件块大小设置的考量因素,并列举了一些常用shell命令。
摘要由CSDN通过智能技术生成

一、HDFS的使用场景

  适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,并不适合用来做网盘应用。

二、HDFS 优缺点

(1)优点

> 高容错性

  • 数据自动保存多个副本。它通过增加副本的形式,提高容错性。

  • 某一个副本丢失以后,它可以自动恢复。

> 适合处理大数据

  • 数据规模:能够处理数据规模达到GB、TB、甚至PB级别的数据;
  • 文件规模:能够处理百万规模以上的文件数量,数量相当之大。

> 可构建在廉价机器上,通过多副本机制,提高可靠性

(2)缺点

> 不适合低延时数据访问,比如毫秒级的存储数据,是做不到的。

> 无法高效的对大量小文件进行存储。

  • 存储大量小文件的话,它会占用NameNode大量的内存
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小夕Coding

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值