初步了解HDFS与MapReduce

最新推荐文章于 2022-08-28 03:37:49 发布

magina_lil

最新推荐文章于 2022-08-28 03:37:49 发布

阅读量747

点赞数

分类专栏： hadoop 文章标签： mapreduce hadoop 大数据 hdfs 分布式文件系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/magina_lil/article/details/49152233

版权

hadoop是一个开源框架,可编写和运行分布式应用和处理大规模数据

核心是HDFS以及MapReduce

HDFS 分布式文件系统

HDFS具备的优点：

1）高容错性，数据自动保存多个副本在不同机架上，提高容错性，副本数低于最小副本数时会自动备份，我们无需关心具体实现

2）适合批处理，通过移动计算，而不是移动数据

3）适合大数据，处理数据达到TB甚至PB级，能够处理百万以上规模的文件（由于NN的构造，不适合处理数量多的小文件）

4）流式文件访问，文件只能进行读写操作，不能进行修改操作（修改文件名不算），参考网盘的概念

5）可构建在廉价的机器上，因为是靠集群的性质来实现的，所以不需要太好的机器，通过保存多副本（增加了冗余）提高可靠性，不易丢失

不适用的场景

1）低延迟数据访问，无法做到毫秒内的读写数据，它适合高吞吐率的场景，比如某一时刻写入大量数据

2）小文件存储，这样NN会消耗大量内存，NN存储的是metadata,这些数据都在内存中,读取小文件寻道时间会超过读写时间,违反HDFS设计思路

3）并发写入，文件随机修改，不允许多线程同时写一个文件，只支持文件的增删，不能修改

HDFS如何存储数据:

HDFS采用Master/Slave的架构存储数据,由4个部分组成HDFS Client、NameNode

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
初步了解HDFS与MapReduce

hadoop是一个开源框架,可编写和运行分布式应用和处理大规模数据核心是HDFS以及MapReduceHDFS 分布式文件系统HDFS具备的优点： 1）高容错性，数据自动保存多个副本在不同机架上，提高容错性，副本数低于最小副本数时会自动备份，我们无需关心具体实现2）适合批处理，通过移动计算，而不是移动数据3）适合大数据，处理数据达到TB甚至PB级，能够处理百万以上规
复制链接

扫一扫

专栏目录

博客等级

码龄9年

43
原创

11
点赞

25
收藏

9
粉丝

关注

私信

热门文章

分类专栏

nifi 3篇
flink 3篇
hadoop 13篇
hbase 4篇
linux 10篇
lua 1篇
java基础 10篇
eclipse 字符集编码 1篇
算法 1篇
kafka 1篇
git 1篇
javaee 2篇
hive 1篇
区块链 7篇
JS 1篇
elasticsearch 1篇

最新评论

Nifi组件脚本开发—ExecuteScript 使用指南（一）(转)
CSDN-Ada助手: 非常感谢CSDN博主分享的"Nifi组件脚本开发—ExecuteScript 使用指南（一）(转)"博客，对使用ExecuteScript组件进行脚本开发的读者来说应该非常有用。我觉得下一篇你可以继续就ExecuteScript组件的高级使用技巧、脚本优化以及实用场景等方面进行探讨，相信会有更多读者受益于此。期待看到您的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
flink dataStream API
你嘉圣同学: 那这个怎么验证呢？尤其是forward，这个不能之说结论呀。另外你说的task是subtask吧？并行化之后最终都是在subtask执行的
修改hdfs的副本数量
magina_lil: 实际存储不会立即减小,删除副本之后会有一个策略,将数据放入回收站. 好像是24小时之后才会真正的减小.具体的你再查一下
修改hdfs的副本数量
daleHaven: 请问减小了副本数之后实际的存储是否减小了？
修改hdfs的副本数量
Deepturn: 我在大佬的评论区瑟瑟发抖

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。