原问题
min x c T x s . t . A x = b x ≥ 0 (1) \min_x \;c^Tx\\s.t. \;Ax=b\\x\geq 0 \tag{1} xmincTxs.t.Ax=bx≥0(1)
对偶问题
max
y
b
T
y
s
.
t
.
A
T
y
+
s
=
c
s
≥
0
(2)
\max_y\;b^Ty\\s.t.\;A^Ty+s=c\\s\geq 0\tag{2}
ymaxbTys.t.ATy+s=cs≥0(2)
A
∈
R
m
×
n
,
x
∈
R
n
,
s
∈
R
n
,
y
∈
R
m
A \in \R^{m\times n}, x \in \R^{n}, s \in \R^{n}, y \in \R^{m}
A∈Rm×n,x∈Rn,s∈Rn,y∈Rm
推导
引入拉格朗日函数:
L
(
x
,
λ
,
μ
)
=
c
T
x
+
λ
T
(
A
x
−
b
)
−
μ
T
x
L(x,\lambda,\mu) = c^Tx+\lambda^T(Ax-b)-\mu^T x
L(x,λ,μ)=cTx+λT(Ax−b)−μTx要求
μ
>
0
\mu >0
μ>0,
λ
\lambda
λ随意。容易验证:
sup
λ
,
μ
L
(
x
,
λ
,
μ
)
=
c
T
x
\sup_{\lambda,\mu} L(x,\lambda,\mu) = c^Tx
λ,μsupL(x,λ,μ)=cTx因而原问题就等价于:
inf
x
∈
D
sup
λ
,
μ
L
(
x
,
λ
,
μ
)
,
(P)
\inf_{x\in D}\sup_{\lambda,\mu} L(x,\lambda,\mu), \tag{P}
x∈Dinfλ,μsupL(x,λ,μ),(P)其中可行域
D
=
{
x
∣
A
x
=
b
,
x
≥
0
}
D=\{x| Ax=b, x \geq 0\}
D={x∣Ax=b,x≥0}。下面我们构造对偶问题:
sup
λ
,
μ
inf
x
L
(
x
,
λ
,
μ
)
.
(D)
\sup_{\lambda,\mu}\inf_{x} L(x,\lambda,\mu). \tag{D}
λ,μsupxinfL(x,λ,μ).(D)
先对 x 取下界:
inf
x
L
(
x
,
λ
,
μ
)
=
−
λ
T
b
+
inf
x
(
c
+
A
T
λ
−
μ
)
T
x
=
{
−
λ
T
b
,
c
+
A
T
λ
−
μ
=
0
−
∞
,
o
t
h
e
r
w
i
s
e
\inf_{x} L(x,\lambda,\mu) \\= -\lambda^Tb + \inf_x{(c+A^T\lambda -\mu)^Tx} \\=\left\{ \begin{array}{lr} -\lambda^Tb, \;\;\;\;c+A^T\lambda -\mu=0& \\ -\infty, \;\;\;\;\;\;\;otherwise& \end{array} \right.
xinfL(x,λ,μ)=−λTb+xinf(c+ATλ−μ)Tx={−λTb,c+ATλ−μ=0−∞,otherwise
显而易见,对偶问题 (D) 值有当
c
+
A
T
λ
−
μ
=
0
c+A^T\lambda -\mu=0
c+ATλ−μ=0 时才有意义。所以对偶问题写成:
max
λ
−
b
T
λ
s
.
t
.
A
T
λ
−
μ
+
c
=
0
μ
≥
0
\max_\lambda\;-b^T\lambda\\s.t.\; A^T\lambda-\mu+c=0\\\mu\geq 0
λmax−bTλs.t.ATλ−μ+c=0μ≥0令
y
=
−
λ
,
s
=
μ
y = -\lambda, s=\mu
y=−λ,s=μ 即变成问题 (2)。