网络拓扑与机器感知

最新推荐文章于 2025-02-17 20:15:02 发布

Simple_Zz

最新推荐文章于 2025-02-17 20:15:02 发布

阅读量1.1k

点赞数 1

分类专栏：大数据文章标签： Hadoop 大数据 HDFS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/love284969214/article/details/82893029

版权

本文探讨了在网络拓扑中，Hadoop如何通过节点间的距离（带宽）来衡量节点关系。介绍了Hadoop默认的扁平化网络假设，以及机架感知的重要性。在低版本和高版本Hadoop中，复本节点的选择策略有所不同，高版本更注重在同一机架内放置副本。HDFS根据客户端位置，选择最近的副本节点提供数据读取服务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

网络拓扑

在本地网络中，两个节点被称为“彼此近邻”是什么意思？在海量数据处理中，其主要限制因素是节点之间数据的传输速率，即带宽稀缺。这里的想法是将两个节点之间的带宽作为距离的衡量标准。不用衡量节点之间的带宽，实际上很难实现（它需要一个稳定的集群，并且在集群中两两节点对数量是节点数量的平方）。

hadoop为此采用了一个简单的方法：把网络看作一棵树，两个节点之间的距离是他们到最近共同祖先的距离总和。该树中的层次是没有预先设定的，但是相对与数据中心，机架和正在运行的节点，通常可以设定等级。

节点距离：两个节点到达最近的共同祖先的距离总和。

具体想法是针对以下每个常见，可用带宽依次递减：

同一节点上的进程。
同一机架上的不同节点。
同一数据中心中不同机架上的节点。
不同数据中心的节点。

举个例子，假设有数据中心d1，机架r1中的节点n1。该节点可以表示为“/d1/r1/n1”。利用这种标记，这里给出四种距离描述：

网络拓扑概念

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。