2020年10月31日 Homa_ An Efficient Topology and Route Management Approach in SD-WAN Overlays

2020年10月31日 Homa: An Efficient Topology and Route Management Approach in SD-WAN Overlays

Homa: An Efficient Topology and Route Management Approach in SD-WAN Overlays

论文出处

Infocom 2020,session 9-G: SDN IV

论文作者

Diman Zad Tootaghaj, Hewlett Packard Labs (USA)
Faraz Ahmed, Hewlett Packard Labs (USA)
Puneet Sharma, Hewlett Packard Labs (USA)
Mihalis Yannakakis, Columbia University (USA)

摘要(Abstract)

This paper presents an efficient topology and route management approach in Software-Defined Wide Area Networks (SD-WAN). Traditional WANs suffer from low utilization and lack of global view of the network. Therefore, during failures, topology/service/traffic changes, or new policy requirements, the system does not always converge to the global optimal state. Using Software Defined Networking architectures in WANs provides the opportunity to design WANs with higher fault tolerance, scalability, and manageability. We exploit the correlation matrix derived from monitoring system between the virtual links to infer the underlying route topology and propose a route update approach that minimizes the total route update cost on all flows. We formulate the problem as an integer linear programming optimization problem and provide a centralized control approach that minimizes the total cost while satisfying the quality of service (QoS) on all flows. Experimental results on real network topologies demonstrate the effectiveness of the proposed approach in terms of disruption cost and average disrupted flows.

论文动机

为解决目前企业使用SD-WAN部署中存在的拓扑简单、不灵活的问题,提出了一种基于动态端到端(overlay)检测的方法来获取承载网(underlay)的状态信息,并根据这些状态信息以最小化链路成本为优化目标、以QOS、流量工程等为约束条件,计算出合适的overlay网络连接。

内容摘要

1. 作者将目前SD-WAN工作归为三类:

  1. Resilient Overlay:
    关于弹性覆盖网路由的工作集中在部署和选择中继节点以提高弹性。即当底层网络出现问题时,通过间接叠加路由重新路由流量。这需要根据underlay 拓扑的属性选择中继节点

  2. Overlay Topology Design:
    这些方法首先提出了识别底层网络拓扑结构的方法,然后在底层中找到最优的节点集来放置覆盖节点。然而,作者对问题设置在两个方面是不同的。首先,在企业SD-WAN部署中,底层节点是分支机构,所有分支机构充当覆盖节点。其次,不对底层网络拓扑(即Internet的拓扑)做任何假设。

  3. Underlay-overlay interaction:
    这些方法着重于分析由于叠加和底层路由协议的独立性而产生的冲突,并通过跨层协作提出改进建议。跨层冲突给SD-WAN运营商带来了流量工程挑战,因为这种冲突可能导致覆盖层性能下降

2. 底层网络推断

  1. 通过在overlay各节点之间发送ping报文,感知每个节点对(pairs)之间的相关性。
    通过Pearson相关系数计算每一对overlay节点之间的相关性,根据阈值推断这两对节点之间的overlay链路在底层映射的路径是否存在重叠链路(overlapping links)。

在这里插入图片描述

  1. 由两两节点对之间的相关性构造相关矩阵:
    C M ( e i j , t , e n m , t ′ ) = c o r r ( d i j , t , d m n , t ′ ) CM(e_{ij,t},e_{nm,t^{'}})=corr(d_{ij,t}, d_{mn,t^{'}}) CM(eij,t,enm,t)=corr(dij,t,dmn,t)
  2. 如果两个overlay link之间的相关性大于一定阈值,则认为它们在承载网中 共用了相同链路(indirect 也要考虑在内)

3. 最小成本(Min-Cost)的网络重构(重配置)

  1. 链路成本:包含固定成本可变成本
    Link Cost:
    p i j , t = α i j , t + ζ i j , t . f i j , t , ∀ ( i , j ) ∈ E o , ∀ t ∈ I p_{ij,t}=\alpha_{ij,t}+\zeta_{ij,t}.f_{ij,t},\forall (i,j)\in E_o,\forall t \in I pij,t=αij,t+ζij,t.fij,t,(i,j)Eo,tI
    等式右边第一项是固定成本,第二项时变化成本。
    其中, α i j , t \alpha_{ij,t} αij,t是固定成本, ζ i j , t \zeta_{ij,t} ζij,t是链路的带宽消耗费用比, f i j , t f_{ij,t} fij,t是链路中的流数目。

  2. 优化问题描述

在这里插入图片描述

描述:
4a:是链路容量约束
4b:是流量平衡约束,即流出一个节点的总流量等于进入该节点的总流量以及该节点产生/消耗的净流量的总和。
4c、4d:指定接口t在节点 i i i上的接口 t t t的容量限制,即 c i , t c_{i,t} ci,t。在我们的设置中,我们将接口 t t t的覆盖链路( i i i, j j j)的容量设置为 c i , t c_{i,t} ci,t c j , t c_{j,t} cj,t的最小值。
4e:确保当至少有一个流使用link ( i i i, j j j) on interface t t t时, λ = 1 λ=1 λ=1
4f:QoS约束和显示的最大数量之间的相关性( Ω h Ω_h h)选择覆盖链接在新的设置。
4g:取值范围
式(4)的目标是最小化网络重构成本,使所有的流都能在链路容量和QoS约束下路由。

假设边的容量大到足以容纳所有需求流的总和,且QoS阈值(h)设为无穷大。该问题可以转化为buy-at-bulk network design,是NPHard。

4. 构造贪心算法求解Min-Cost问题

  1. Inflated Greedy ALgorithm

在这里插入图片描述
2. Constrained Shortest Path Algorithm

在这里插入图片描述

5. Homa处理方法

  1. 当underlay 链路/节点 故障时
    底层网络中任何导致当前覆盖网络断开连接的链路/节点故障都将被检测并发送给控制器。然后控制器删除覆盖网络中使用底层拓扑中失败的链接/节点的直接链接。如果一个或多个流由于故障而中断,控制器将使用更新的覆盖网络重新计算网络状态和路由。该算法将更新代价最小化,并为每个流提供QoS。

  2. 控制器故障
    在控制器故障期间,如果网络的状态没有改变,网络仍然能够传输流量。如果网络状况发生变化,比如出现故障或新服务,Homa仍然可以使用贪心方法执行路由更新,而不需要全局查看网络状态。在这种情况下,每个检测到故障或新流量的路由器将根据自己的网络状态尝试寻找新路由。如果路由器找不到瓶颈剩余容量大于流量 h h h(即 d h d_h dh)需求量的任何路由,则该流量将被丢弃。

6. 实验评估

  1. 实验环境
    Topology Zoo中的BellCanada拓扑作为ISP拓扑+作者自己搭建SD-WAN实验平台。

在这里插入图片描述
在这里插入图片描述

  1. Failure Resiliency
    考虑六个需求流,其中每个需求对的流量为三个。我们将底层网络拓扑中的链路故障随机数从1增加到10,并观察中断流的总数。

在这里插入图片描述

在底层网络中使用5个随机中断的链路,并将需求对从1对增加到10对。

在这里插入图片描述

  1. Demand Loss
    在相同的实验环境下,评估需求的损失数量,即重新配置网络后丢失流的数量(流的需求量)。

在这里插入图片描述

  1. Inferring the underlay topology
    将需求对从1对增加到10对。同时,我们假设底层网络拓扑中存在单次随机故障,观察1) 网络重配置成本,2) 中断流数量。假设1)对底层网络拓扑具有完全的可观察性,2)使用来自监控系统的相关矩阵。图显示了这个场景的实验结果。如表所示,使用相关矩阵的结果与我们对网络拓扑具有完全可观测性的情况非常接近。

在这里插入图片描述

论文和PPT下载

https://download.csdn.net/download/m0_52158631/13082596

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值