NameNode中数据节点的保存(2)——NetworkTopology

读程序的手艺人

于 2011-12-27 17:39:34 发布

阅读量3k

点赞数

分类专栏： HDFS源码解析文章标签：路由器集群数据结构存储网络 string

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xhh198781/article/details/7106215

版权

HDFS源码解析专栏收录该内容

45 篇文章

订阅专栏

本文深入剖析了Hadoop NameNode如何利用NetworkTopology类存储和管理集群中的DataNode节点，通过树状网络拓扑结构表示节点在物理位置的关系，以优化距离计算和负载评估。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在前面的一篇文章中，我分析了NameNode用来保存DataNode节点的一种数据结构——Host2NodesMap类，它被用来存储主机与DataNode节点之间的映射，同时NameNode用这个数据结构来计算整个集群的负载情况，在本文，我将介绍另一种DataNode节点的存储结构——NetworkTopology。NetworkTopology类将整个集群中的DataNode节点存储成了一个树状网络拓扑图，当然，在NameNode节点把一个DataNode节点交给NetworkTopology类保存之前，它已经将这个DataNode节点坐在的主机ip解析成了一个/*/*/*/*的形式，这样的话，NetworkTopology就更好处理了。

先来看看与NetworkTopology类相关联的类图，以便能更好地了解它是如何来表示整个集群中DataNode节点位置的。

Node接口表示网络拓扑图中节点的抽象，一个Node的实例可能表示的是一个DataNode节点，也可能是集群中的路由器或者是机架，而InnerNode的实例表示的可能是一个路由器，也可能是机架，在中是这样判断是不是机架的：

boolean isRack() {
      if (children.isEmpty()) {
        return true;
      }

      Node firstChild = children.get(0);
      if (firstChild instanceof InnerNode) {
        return false;
      }

      return true;
}

Node接口的基本实现是NodeBase，用来表示一个节点实体，并且顶多用来表示HDFS集群中的DataNode节点，它的四个属性含义是：

protected String name; //该结点的名称(host:port)
protected String location; //该结点的网络位置
protected int level; //该结点在网络拓扑中的层次

protected Node parent; //该结点的父结点

集群中的一个路由器节点可以包含多个路由器节点，也可以包含多个机架节点，一个机架节点可以包含多个DataNode节点，这就是NameNode通过NetworkTopology来管存储群中所有节点的一种方式，那么，它为何要这样来存储呢?实际上，NameNode通过这种树状网络拓扑结构来表示集群中DataNode节点在物理位置上的关系，以方便任何两个DataNode节点之间距离的计算，同时也为NameNode评估集群的负载情况提供计算依据，例如，属于同一个机架的DataNode节点它们在物理上是非常近的，可能就在一个局域网内，同时NamNode也可以计算这个局域网当前的网络带宽的占用情况(这对NameNode节点为一个文件的block副本选取那些存储节点以提高性能是非常重要的)。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。