Shortest Path Problem :The Model
Python调用Gurobi求解SPP
SPP的对偶问题
Python调用Gurobi求解SPP的对偶问题
SPP模型学术界的标准写法
SPP对偶问题的直观理解
Python调用Gurobi:Shortest Path Problem及其对偶问题的一些探讨
最短路问题
(Shortest Path Problem, SPP)
是一类非常经典的问题。基本的SPP
不是NP-hard
,可以用Dijkstra
等算法在多项式时间内求解到最优解。今天我们不探讨这些求解算法,仅探讨用求解器Gurobi
和Python
来求解这个问题。
我们首先来看一个例子网络:s
为起点,t
为终点。
注意到边的权重是
-10
,那么在这个问题中就存在负环,例如,这个环的总权重为-5
。这种情况下,对偶问题是无解的。用这个例子目的就是稍微拓展一下这一点。
Shortest Path Problem :The Model
首先,我们将Shortest Path Problem
建模成一个Integer Programming
模型,如下:
Python调用Gurobi求解SPP
下面我们用Python
调用Gurobi
,并用上图中的算例进行建模求解。
首先,导入模块,并将上述网络转换成字典格式数据
from gurobipy import *
import pandas as pd
import numpy as np
Nodes = ['s', 'a', 'b', 'c', 't']
Arcs = {('s','a'): 5
,('s','b'): 8
,('a','c'): 2
,('b','a'): -10
,('c','b'): 3
,('b','t'): 4
,('c','t'): 3
}
Arcs
然后建模
model = Model('dual problem')
# add decision variables
X = {}
for key in Arcs.keys():
index = 'x_' + key[0] + ',' + key[1]
X[key] = model.addVar(vtype=GRB.BINARY
, name= index
)
# add objective function
obj = LinExpr(0)
for key in Arcs.keys():
obj.addTerms(Arcs[key], X[key])
model.setObjective(obj, GRB.MINIMIZE)
# constraint1 1 and constraint 2
lhs_1 = LinExpr(0)
lhs_2 = LinExpr(0)
for key in Arcs.keys():
if(key[0] == 's'):
lhs_1.addTerms(1, X[key])
elif(key[1] == 't'):
lhs_2.addTerms(1, X[key])
model.addConstr(lhs_1 == 1, name = 'start flow')
model.addConstr(lhs_2 == 1, name = 'end flow')
# constraints 3
for node in Nodes:
lhs = LinExpr(0)
if(node != 's' and node != 't'):
for key in Arcs.keys():
if(key[1] == node):
lhs.addTerms(1, X[key])
elif(key[0] == node):
lhs.addTerms(-1, X[key])
model.addConstr(lhs == 0, name = 'flow conservation')
model.write('model_spp.lp')
model.optimize()
print(model.ObjVal)
for var in model.getVars():
if(var.x > 0):
print(var.varName, '\t', var.x)
求解结果如下
Solution count 1: 3
Optimal solution found (tolerance 1.00e-04)
Best objective 3.000000000000e+00, best bound 3.000000000000e+00, gap 0.0000%
3.0
x_s,b 1.0
x_a,c 1.0
x_b,a 1.0
x_c,t 1.0
可以看到,最短路为,路径长度为3.
SPP的对偶问题
下面我们写出这个问题的对偶问题,我们对每个约束引入对偶变量,如下
然后SPP
的对偶问题变成
Python调用Gurobi求解SPP的对偶问题
下面调用gurobi进行求解
model = Model('dual problem')
pi_a = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_a")
pi_b = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_b")
pi_c = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_c")
pi_s = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_s")
pi_t = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_t")
obj = LinExpr(0)
obj.addTerms(1 , pi_s)
obj.addTerms(1 , pi_t)
model.setObjective(obj, GRB.MAXIMIZE)
# lhs relation , rhs
model.addConstr(pi_s - pi_a <= 5)
model.addConstr(pi_s - pi_b <= 8)
model.addConstr(pi_t + pi_c <= 3)
model.addConstr(pi_t + pi_b <= 4)
model.addConstr(pi_b - pi_a <= -10)
model.addConstr(pi_a - pi_c <= 2)
model.addConstr(pi_c - pi_b <= 3)
model.write('model2.lp')
model.optimize()
print(model.ObjVal)
for var in model.getVars():
print(var.varName, '\t', var.x)
求解之后,结果为无解
Gurobi Optimizer version 9.0.1 build v9.0.1rc0 (win64)
Optimize a model with 7 rows, 5 columns and 14 nonzeros
Model fingerprint: 0xd51f0a26
Coefficient statistics:
Matrix range [1e+00, 1e+00]
Objective range [1e+00, 1e+00]
Bounds range [1e+03, 1e+03]
RHS range [2e+00, 1e+01]
Presolve time: 0.00s
Presolved: 7 rows, 5 columns, 14 nonzeros
Iteration Objective Primal Inf. Dual Inf. Time
0 2.0100000e+03 5.026250e+02 0.000000e+00 0s
Solved in 2 iterations and 0.01 seconds
Infeasible model
让我们修改边的长度为10
,也就是把下面的约束改成
# model.addConstr(pi_b - pi_a <= -10)
model.addConstr(pi_b - pi_a <= 10)
这样就有解了
Iteration Objective Primal Inf. Dual Inf. Time
0 2.0100000e+03 5.020000e+02 0.000000e+00 0s
5 1.0000000e+01 0.000000e+00 0.000000e+00 0s
Solved in 5 iterations and 0.01 seconds
Optimal objective 1.000000000e+01
10.0
pi_a 995.0
pi_b 992.0
pi_c 993.0
pi_s 1000.0
pi_t -990.0
可以看到,最短路为,路径长度为10.
SPP模型学术界的标准写法及其求解
SPP模型学术界的标准写法
上面的写法是比较适合初学者的,学者们一般不这么写,下面我们来整理一下比较专业的写法。主要参考文献^[1] 和^[2]。我们将SPP的模型可以写为:
其中当时, , 当时, , 否则。
当然,我这里写out, in什么的纯粹为了看着直观,其实也不是很直观,论文里有的是FS,BS。
也有写成下面形式的
看个人喜好了。
由于SPP
具有整数最优解特性,也就是将决策变量松弛成,依然总是存在整数最优解. 因此,SPP
等价于下面的LP
。
相应的,对偶问题则变成
到这一步其实已经结束了。我们可以做一个比较直观的理解(这个理解理论上有缺陷):
其实就是从点出发,到达点的收益的一个衡量。当然,数值上并不是这样的,之后我们做一步操作,就可以让数值上也相等了。
首先把所有对偶变量取个相反数,等价转化为
因为是free的,因此是等价的。
由于是无约束的,而我们只是最大化,因此我们可以直接把设置成0,也就是约束,这样并不会改变最优解。OK,我们仍然保持目标函数为,那我们就可以把模型等价转化为
这样我们就能保证所有的对偶变量都是非负的,而且这个模型与原模型完全等价,而且问题复杂度相同。
SPP对偶问题的直观理解
依据这个模型,我们就可以对对问题进行一个比较深入的直观理解了。
就像生产计划问题的对偶问题,可以按照出租的逻辑来理解一样,SPP问题的原问题是一个客户要在网络上从起点到终点走一条最短路,花销最少。那SPP的对偶问题就可以理解为,我是网络的运营者,我需要在每个结点设置收费金额(或者惩罚金额),我设置的惩罚金额必须要使得我的收益在对方走最短路的情况下最大化。当然,对方不走最短路,我的收益会更大,这个惩罚,在一条边连接的两个节点上,差值不能超过这条边的权重。
这里,我们戏称运营者为地主。地主为了让平民走得最短,就得拼命的加成法,狠狠收费。怎么衡量地主收费收的是不是狠呢?下面给出一些直观理解的 分享(并不完全严谨,仅供参考,帮助理解)
一条边的收费上限是。地主收费不狠,那就是,说明他还有点良心。余量越多,他的收益就越小,对应的,原问题相应的解就越远离最短路。收的越狠,接近了,原问题(平民)就不敢瞎浪了,乖乖走到最短路,毕竟财力限制了他的想象力。当,这就使得原问题走到最短路。
改进的对偶问题的解,也就是原问题的对偶变量,正好也符合上面的理解。
SPP模型学术界的标准形式的求解
按照修改的模型,我们再将今天的例子求解一下,约束按照修改的模型进行构建
from gurobipy import *
import pandas as pd
import numpy as np
model = Model('dual problem')
pi_a = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_a")
pi_b = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_b")
pi_c = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_c")
pi_s = model.addVar(lb=0, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_s")
pi_t = model.addVar(lb=-1000, ub=1000, vtype=GRB.CONTINUOUS, name= "pi_t")
obj = LinExpr(0)
# obj.addTerms(1 , pi_s)
obj.addTerms(1 , pi_t)
model.setObjective(obj, GRB.MAXIMIZE)
'''
Arcs =
{('s', 'a'): 5,
('s', 'b'): 8,
('a', 'c'): 2,
('b', 'a'): -10,
('c', 'b'): 3,
('b', 't'): 4,
('c', 't'): 3}
'''
# lhs relation , rhs
# 注意这里约束都进行了调整
model.addConstr(pi_a - pi_s <= 5)
model.addConstr(pi_b - pi_s <= 8)
model.addConstr(pi_t - pi_c <= 3)
model.addConstr(pi_t - pi_b <= 4)
model.addConstr(pi_a - pi_b <= 10)
model.addConstr(pi_c - pi_a <= 2)
model.addConstr(pi_b - pi_c <= 3)
model.addConstr(pi_s == 0)
model.write('model2.lp')
model.optimize()
print(model.ObjVal)
for var in model.getVars():
print(var.varName, '\t', var.x)
求解结果如下
Solved in 2 iterations and 0.01 seconds
Optimal objective 1.000000000e+01
10.0
pi_a 5.0
pi_b 6.0
pi_c 7.0
pi_s 0.0
pi_t 10.0
看到了把,跟前面的理解是相同的。可以看做是在点处地主能够收到的过路费
的最大值。在终点能够收到的过路费的最大值就是最终的目标函数。而过路费必须满足决策者提出的的反垄断要求。
然后平民就乖乖走出了最短路。这问题就这么愉快的解决了。
不知道小伙伴们有没有一个疑问,上面我写这个SPP
的对偶的时候,比较容易的就写出来了,也就是像SPP
这样的问题,写对偶还是比较简单的,但是对于一些比较复杂的问题,约束里面包含了挺多复杂的东西,怎么写出对偶呢?之后的博文会陆续推出如何写出大规模LP
的对偶问题。
先去搞研究了,今天就写到这里啦,下期再见。
参考文献
[1] :Garg, N., & Koenemann, J. (2007). Faster and simpler algorithms for multicommodity flow and other fractional packing problems. SIAM Journal on Computing, 37(2), 630-652https://doi.org/10.1137/S0097539704446232[2]:Cappanera, P., & Scaparra, M. P. (2011). Optimal allocation of protective resources in shortest-path networks. Transportation Science, 45(1), 64-80.http://dx.doi.org/10.1287/trsc.1100.0340