分布式存储和分布式计算的结合

本文介绍了分布式存储的思路,以HDFS为例阐述其特点,包括分块存储、数据冗余和元数据管理。接着讨论了分布式批处理的概念,通过砍树的例子解释MapReduce和Spark的工作原理,并对比了分布式流式处理与批处理的差异,强调流式处理在实时性和灵活性上的优势。
摘要由CSDN通过智能技术生成

再介绍了之前的hadoop以及spark的相关组件之后,就像一辆汽车一样,只有将所有的组件进行组装之后他才可以正常的上路,在公路上疾驶,今天我们就将之前的组件进行一个简单的安装

首先是油箱--分布式存储

在当今社会,数据量越来越大,就像女孩子看电视剧一样,我把你喜欢的电视剧、电影等等的视频资源全给你,一共10PB,只有一次的存储机会,那我们应该怎么存储呢?赵本山说过把一只大象存入冰箱一共需要三不,打开冰箱,放入大象,关闭冰箱,同样的,存数据也分为这么三个步骤,打开电脑,数据存磁盘,关闭电脑,但是存在一个问题,真的可以把大象放入到冰箱中吗?相对于10PB的影视资料来说,现在的个人设备是很难完成这个任务的,但是女孩子又舍不得这些帅哥怎么办,那么女生就会找几个自己的好闺蜜,把这10PB的电视剧按照类型进行分类,然后每个闺蜜的电脑上放几部,然后存放所有的数据,这就是分布式的思维,我们将大文件切割成一个个的小文件,然后部署多台服务器,每台服务器上存储一点,也就完成了数据的存储

数据存储完了之后,如果有一天想看电视剧了,可是不知道那个闺蜜的电脑上存储着我要看的电影,只能每个人的打电话去问他那里有什么电影,浪费时间跟精力,等找到之后也就没有想看的心情了,那怎么办呢?那我就可以找一个人,记录一下哪一部电视剧放在谁那里,这就是管理员,它会存储元

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值