hdfs学习中的一些疑问

uflswe

已于 2024-03-01 19:02:47 修改

阅读量248

点赞数 2

文章标签： hdfs java hadoop

于 2024-03-01 17:17:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uflswe/article/details/136401831

版权

在学习hdfs的过程中，遇到一些疑问，做个记录（持续更新）

1.问：hdfs设计的读写机制都会优先选择本地副本，本地副本是相对于谁的？生产环境中用户不都读的线上集群吗？

答：在Hadoop分布式文件系统（HDFS）中，提到"本地副本"（Local Replica）的概念时，"本地"通常是相对于正在执行读写操作的客户端或者计算任务（如MapReduce作业中的一个Map或Reduce任务）来说的。在HDFS中，数据被切分成多个块（block），每个块被复制到多个DataNode上以提供冗余。

当一个客户端或计算任务尝试读取一个数据块时，HDFS会尝试选择一个最近的副本来进行读取操作：

1）. 如果客户端正在运行的节点也是一个DataNode，并且存有所需数据块的副本，这个副本就是"本地副本"，因为它在与客户端相同的物理节点上。
2）. 如果没有本地副本，HDFS会尝试找到一个从网络拓扑的角度来看离客户端最近的副本，可能是同一个机架上的其他节点上的副本，或者是距离较近的其他机架上的节点。
3）. 如果客户端不直接运行在Hadoop集群的任何DataNode上，那么"本地"就没有那么直观的含义了。在这种情况下，HDFS可能会提供一个最近的DataNode上的副本，尽管这个副本相对于客户端来说实际上是远程的。

因此，在HDFS中讨论"本地副本"时，"本地"的意思通常依赖于客户端或计算任务的物理位置。这种副本选择机制是为了优化读取效率和减少网络传输开销。

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
hdfs学习中的一些疑问

答：在Hadoop分布式文件系统（HDFS）中，提到"本地副本"（Local Replica）的概念时，"本地"通常是相对于正在执行读写操作的客户端或者计算任务（如MapReduce作业中的一个Map或Reduce任务）来说的。2. 如果没有本地副本，HDFS会尝试找到一个从网络拓扑的角度来看离客户端最近的副本，可能是同一个机架上的其他节点上的副本，或者是距离较近的其他机架上的节点。因此，在HDFS中讨论"本地副本"时，"本地"的意思通常依赖于客户端或计算任务的物理位置。生产环境中用户不都读的线上集群吗？
复制链接

扫一扫

uflswe CSDN认证博客专家 CSDN认证企业博客

码龄13年

13: 原创

37万+: 周排名

13万+: 总排名

2万+: 访问

: 等级

375: 积分

2: 粉丝

11: 获赞

4: 评论

24: 收藏

私信

关注

热门文章

分类专栏

ESB
serviceMix
C# 2篇
基础理论 1篇
技巧 2篇
人工智能 2篇
Tensorflow 1篇

最新评论

hdfs学习中的一些疑问
CSDN-Ada助手: 恭喜你写了第17篇博客！看到你在hdfs学习中遇到一些疑问，我觉得这是一个很好的探索方向。我希望你可以继续坚持写作，分享你的学习心得和解决疑问的过程。或许你可以尝试写一些关于解决hdfs学习中疑问的经验分享，或者探讨一些hdfs学习中的技巧和方法，这样可以帮助更多的人。加油！期待你的下一篇作品。
hdfs学习中的一些疑问
uflswe: 对遇到的疑惑会持续记录更新
JAVA学习-多线程-sychronized关键字
CSDN-Ada助手: 恭喜您撰写第16篇博客！标题中的“JAVA学习-多线程-sychronized关键字”引起了我的兴趣。阅读您的博客让我对这个主题有了更深入的了解。感谢您分享关于多线程和synchronized关键字的知识。您的博客内容非常清晰明了，我非常欣赏您的解释和例子。您对多线程和synchronized关键字的理解似乎非常扎实，这使我从中获益匪浅。希望您能够继续分享更多关于JAVA学习的内容，让我们读者受益更多。在下一步的创作中，我建议您可以探讨一些与多线程相关的挑战和解决方案，或者介绍一些在实际项目中使用多线程和synchronized关键字的最佳实践。这样的话，读者们将更加受益，因为他们可以了解到如何应对一些复杂的情况，并学习到如何正确地使用这些关键字。再次感谢您的分享，并期待着您未来更多精彩的博客！
seaborn中boxplot各值计算方法
yxcooler: ggboxplot和 boxplot 计算四分位数不一样
为什么Java可以跨平台c/c++不可以吗
魔人布欧: > 感悟：尼玛，表达能力不好真是不行，还得好好练练。读者评：精髓

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。