HDFS概述--图文分析HDFS是如何存储大文件的

HDFS概述

DHFS(Hadoop Distributed File System),Hadoop分布式文件系统

适合存储大型数据(比如TB和PB),其就是使用HDFS作为存储系统

HDFS对数据文件的访问通过流的方式进行处理,这就意味着可以通过命令和MapReduce程序的方式

可以直接使用HDFS

HDFS使用多台计算机存储文件,并且提供统一的访问接口,像是访问普通文件系统使用分布式文件系统

 

现在有一个2T的a.txt 在一台电脑上无法直接放下,怎么解决?引申出下面的问题

如何解决大文件存储问题?答:切分

完整的文件a.txt被切分到3台电脑上,存放在不同的电脑上,怎么去访问呢?

为了解决这个问题:提出了HDFS文件系统

HDFS相当于做了资源整合,相当于node01、node02和node03贡献出了一块1T磁盘,一共3个T就可以放下2T的a.txt文件

这个思想就是分布式存储思想

 

有一个客户端Client要访问HDFS系统下的a.txt,Client根本不需要知道这个2T的a.txt是如何存储的,只要能完整的读到完整的2T的a.txt即可

--------------华丽的分割线--------------

醒来的时候,希望自己不负大好时光,To know the unknown

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值