min
f
(
x
)
s.t.
x
∈
C
\begin{array}{ll} \min & f(\mathbf{x}) \\ \text { s.t. } & x \in C \end{array}
min s.t. f(x)x∈C
其中
C
C
C是一个闭凸集,
f
f
f是
C
C
C上的凸函数
这种问题叫做凸优化问题
定理1
凸优化局部极小值=全局最小:
设
f
:
C
→
R
f:C\to \mathbb{R}
f:C→R是一个定义在凸集
C
C
C上的凸函数。
设
x
∗
∈
C
\mathbf{x}^{*}\in C
x∗∈C是
f
f
f在
C
C
C上的一个局部极小值,
则
x
∗
\mathbf{x}^{*}
x∗是
f
f
f在
C
C
C上的全局最小值
证明:
因为
x
∗
\mathbf{x}^{*}
x∗是局部极小值,
∃
r
>
0
,
∀
x
∈
B
(
x
∗
,
r
)
,
f
(
x
)
≥
f
(
x
∗
)
\exists r>0,\forall \mathbf{x} \in B(\mathbf{x}^{*},r),f(\mathbf{x})\ge f(\mathbf{x}^{*})
∃r>0,∀x∈B(x∗,r),f(x)≥f(x∗)
设
y
∈
C
\mathbf{y}\in C
y∈C且
y
∉
B
(
x
∗
,
r
)
\mathbf{y}\notin B(\mathbf{x}^{*},r)
y∈/B(x∗,r),则当
0
<
λ
<
r
∥
y
−
x
∗
∥
<
1
0< \lambda <\frac{r}{\| \mathbf{y}-\mathbf{x}^{*}\|}< 1
0<λ<∥y−x∗∥r<1时
x
∗
+
λ
(
y
−
x
∗
)
=
(
1
−
λ
)
x
∗
+
λ
y
∈
B
(
x
∗
,
r
)
\mathbf{x}^{*}+\lambda(\mathbf{y}-\mathbf{x}^{*})=(1-\lambda)\mathbf{x}^{*}+\lambda \mathbf{y} \in B(\mathbf{x}^{*},r)
x∗+λ(y−x∗)=(1−λ)x∗+λy∈B(x∗,r)
f
(
x
∗
)
≤
f
(
(
1
−
λ
)
x
∗
+
λ
y
)
f
(
x
∗
)
≤
(
1
−
λ
)
f
(
x
∗
)
+
λ
f
(
y
)
f
(
x
∗
)
≤
f
(
y
)
\begin{aligned} f(\mathbf{x}^{*})&\le f((1-\lambda)\mathbf{x}^{*}+\lambda \mathbf{y})\\ f(\mathbf{x}^{*})&\le (1-\lambda)f(\mathbf{x}^{*})+\lambda f(\mathbf{y})\\ f(\mathbf{x}^{*})&\le f(\mathbf{y}) \end{aligned}
f(x∗)f(x∗)f(x∗)≤f((1−λ)x∗+λy)≤(1−λ)f(x∗)+λf(y)≤f(y)
定理2
设
f
:
C
→
R
f:C\to \mathbb{R}
f:C→R是一个定义在凸集
C
C
C上的严格凸函数。
设
x
∗
∈
C
\mathbf{x}^{*}\in C
x∗∈C是
f
f
f在
C
C
C上的一个局部极小值,
则
x
∗
\mathbf{x}^{*}
x∗是
f
f
f在
C
C
C上的严格全局最小值
定理3
设
f
:
C
→
R
f:C\to \mathbb{R}
f:C→R是一个定义在凸集
C
C
C上的凸函数。
设凸优化问题的解集为
X
∗
X^{*}
X∗,则
X
∗
X^{*}
X∗是凸集
如果 f f f是严格凸函数,则 X ∗ X^{*} X∗至多存在一个元素
证明:
如果
X
∗
X^{*}
X∗为空集或只有一个元素,结论显然成立
设
x
∗
,
y
∗
∈
X
∗
,
f
∗
=
f
(
x
∗
)
\mathbf{x}^{*},\mathbf{y}^{*}\in X^{*},f^{*}=f(x^{*})
x∗,y∗∈X∗,f∗=f(x∗),
∀
0
≤
λ
≤
1
,
λ
x
∗
+
(
1
−
λ
)
y
∗
∈
C
\forall 0\le \lambda \le 1,\lambda \mathbf{x}^{*}+(1-\lambda)\mathbf{y}^{*}\in C
∀0≤λ≤1,λx∗+(1−λ)y∗∈C
f
∗
≤
f
(
λ
x
∗
+
(
1
−
λ
)
y
∗
)
≤
λ
f
(
x
∗
)
+
(
1
−
λ
)
f
(
y
∗
)
=
f
∗
f^*\le f(\lambda \mathbf{x}^{*}+(1-\lambda)\mathbf{y}^{*})\le \lambda f(\mathbf{x}^{*})+(1-\lambda)f(\mathbf{y}^*)=f^*
f∗≤f(λx∗+(1−λ)y∗)≤λf(x∗)+(1−λ)f(y∗)=f∗
所以
X
∗
X^*
X∗是凸集
如果
f
f
f是严格凸函数,
假设
x
∗
,
y
∗
∈
X
∗
,
f
∗
=
f
(
x
∗
)
\mathbf{x}^{*},y^{*}\in X^{*},f^{*}=f(\mathbf{x}^{*})
x∗,y∗∈X∗,f∗=f(x∗),
f
∗
<
f
(
1
2
x
∗
+
1
2
y
∗
)
<
1
2
f
(
x
∗
)
+
1
2
f
(
y
∗
)
=
f
∗
f^*< f(\frac{1}{2} \mathbf{x}^{*}+\frac{1}{2}\mathbf{y}^{*})< \frac{1}{2} f(\mathbf{x}^{*})+\frac{1}{2}f(\mathbf{y}^*)=f^*
f∗<f(21x∗+21y∗)<21f(x∗)+21f(y∗)=f∗
矛盾
正交投影算子
给定一个非空的闭凸集
C
C
C,正交投影算子
P
C
:
R
n
→
C
P_C:\mathbb{R}^n\to C
PC:Rn→C定义为
P
C
(
X
)
=
arg
min
{
∥
y
−
x
∥
2
:
y
∈
C
}
P_C(\mathbf{X})=\arg\min\{\|\mathbf{y}-\mathbf{x}\|^2:\mathbf{y}\in C\}
PC(X)=argmin{∥y−x∥2:y∈C}
可以理解为
C
C
C中到
x
\mathbf{x}
x最近的那个点
投影第一定理
设 C C C是一个非空闭凸集,则正交投影算子有唯一最优解
证明:
因为这是一个严格的凸函数,并且是一个二次函数,所以他是一个强制函数
因为连续的强制函数在一个非空闭集上一定有最小值,所以这个问题一定有解
因为他是严格凸函数,所以有唯一全局最小值