分布式存储和分布式计算的结合

最新推荐文章于 2024-02-26 11:23:27 发布

LV_ZFG

最新推荐文章于 2024-02-26 11:23:27 发布

阅读量715

点赞数

分类专栏：火花 HADOOP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LV_ZFG/article/details/82344177

版权

本文介绍了分布式存储的思路，以HDFS为例阐述其特点，包括分块存储、数据冗余和元数据管理。接着讨论了分布式批处理的概念，通过砍树的例子解释MapReduce和Spark的工作原理，并对比了分布式流式处理与批处理的差异，强调流式处理在实时性和灵活性上的优势。

摘要由CSDN通过智能技术生成

再介绍了之前的hadoop以及spark的相关组件之后，就像一辆汽车一样，只有将所有的组件进行组装之后他才可以正常的上路，在公路上疾驶，今天我们就将之前的组件进行一个简单的安装

首先是油箱--分布式存储

在当今社会，数据量越来越大，就像女孩子看电视剧一样，我把你喜欢的电视剧、电影等等的视频资源全给你，一共10PB，只有一次的存储机会，那我们应该怎么存储呢？赵本山说过把一只大象存入冰箱一共需要三不，打开冰箱，放入大象，关闭冰箱，同样的，存数据也分为这么三个步骤，打开电脑，数据存磁盘，关闭电脑，但是存在一个问题，真的可以把大象放入到冰箱中吗？相对于10PB的影视资料来说，现在的个人设备是很难完成这个任务的，但是女孩子又舍不得这些帅哥怎么办，那么女生就会找几个自己的好闺蜜，把这10PB的电视剧按照类型进行分类，然后每个闺蜜的电脑上放几部，然后存放所有的数据，这就是分布式的思维，我们将大文件切割成一个个的小文件，然后部署多台服务器，每台服务器上存储一点，也就完成了数据的存储

数据存储完了之后，如果有一天想看电视剧了，可是不知道那个闺蜜的电脑上存储着我要看的电影，只能每个人的打电话去问他那里有什么电影，浪费时间跟精力，等找到之后也就没有想看的心情了，那怎么办呢？那我就可以找一个人，记录一下哪一部电视剧放在谁那里，这就是管理员，它会存储元

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。