HDFS 概念和特点

什么是HDFS?

分布式文件系统则意味着跨越多台计算机,引入网络编程,要处理节点故障

HDFS分布式冗余可扩展的文件系统,使用流式数据访问模式存储超大文件,运行在商用硬件集群上

1) 流式数据访问 

Java的InputStream/OutputStream

一次写入,多次读取是最高效的访问模式

2) 超大文件

3) 商用硬件

并非高可靠的硬件,节点故障还是比较容易发生,要求HDFS被设计成高可用HA和易扩展

HDFS不适用于?

1) 时间延迟低的数据访问:HDFS高数据吞吐量,以时间延迟为代价

2) 大量的小文件:占用内存,一个元数据约150字节

3) 多用户写入,任意修改文件:HDFS只支持单用户写入,且写操作只能append,无法任意位置修改


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值