基本概念
- 可行点(可行解):在规划问题中,满足约束条件的点
- 可行集或可行域:全体可行点组成的集合
- 无约束问题:如果一个问题的可行集是整个空间。
分为三种情况:
- S = ∅ , 则 称 该 问 题 无 解 或 不 可 行 S = \emptyset, 则称该问题无解或不可行 S=∅,则称该问题无解或不可行
- S ≠ ∅ , 但 是 目 标 函 数 在 S 上 无 界 S \not = \emptyset, 但是目标函数在S上无界 S=∅,但是目标函数在S上无界
- S ≠ ∅ 且 目 标 函 数 有 限 的 最 优 解 , 则 称 问 题 有 最 优 解 S \not = \emptyset 且目标函数有限的最优解,则称问题有最优解 S=∅且目标函数有限的最优解,则称问题有最优解
符号问题:
x
∈
R
n
x\in R^n
x∈Rn表示
x
x
x 是向量
x
∈
R
x \in R
x∈R表示
x
x
x 是实数
黑体的是向量
没有加粗的是数
凸集
凸集
定义:设S为n维欧式空间
R
n
R^n
Rn中的一个集合。若对任意两点
x
(
1
)
,
x
(
2
)
∈
S
x^{(1)}, x^{(2)} \in S
x(1),x(2)∈S及每个实数
λ
∈
[
0
,
1
]
\lambda \in [0, 1]
λ∈[0,1] 有
λ
∗
x
(
1
)
+
(
1
−
λ
)
∗
x
(
2
)
∈
S
\lambda * x^{(1)} + (1 - \lambda) * x^{(2)} \in S
λ∗x(1)+(1−λ)∗x(2)∈S
则称S为凸集。
λ
∗
x
(
1
)
+
(
1
−
λ
)
∗
x
(
2
)
\lambda * x^{(1)} + (1 - \lambda) * x^{(2)}
λ∗x(1)+(1−λ)∗x(2)称为
x
(
1
)
x^{(1)}
x(1)和
x
(
2
)
x^{(2)}
x(2)的凸组合。
凸组合
定义:给定m个向量,
x
1
,
x
2
,
.
.
.
,
x
m
∈
R
n
x^1, x^2,...,x^m \in R^n
x1,x2,...,xm∈Rn, 以及满足
∑
λ
i
=
1
\sum{\lambda_i = 1}
∑λi=1的非负实数
λ
i
∈
R
\lambda_i \in R
λi∈R, 称向量
λ
1
x
1
+
λ
2
x
2
+
.
.
.
+
λ
m
x
m
\lambda_1 x^1 + \lambda_2 x^2 + ... + \lambda_m x^m
λ1x1+λ2x2+...+λmxm为
x
x
x 的凸组合。
根据向量知识凸组合形成的集合图形为两顶点之间的连线
定理:如果S为凸集那么其中具有任意有限元素的凸组合。
凸集性质:
- 凸集放大 α \alpha α倍仍为凸集
- 凸集相交仍为凸集
- 凸集的元素求和仍为凸集
- 凸集的元素相减仍为凸集
凸包
定义:凸包,给定一堆点,这堆点的凸包就是包含这些点的最小凸集。
这些点称为单纯形的顶点。
闭包:
- 闭集的闭包就是它本身
- 开集的闭包就是它本身加上它的边界集
凸锥
定义:设有集合
C
⊂
R
n
C\subset R^n
C⊂Rn, 若对每一点
x
∈
C
x \in C
x∈C,当
λ
\lambda
λ 取任何非负数时,都有
λ
x
∈
C
\lambda x \in C
λx∈C, 称C为锥,如果C为凸集,则称C为凸锥。
从零点到x延长线上的点仍在集合C中
凸锥组合:
{
∑
λ
i
α
(
i
)
∣
λ
i
>
=
0
,
i
=
1
,
2...
k
}
\{\sum{\lambda_i \alpha^{(i)}} | \lambda_i >= 0, i = 1, 2 ...k\}
{∑λiα(i)∣λi>=0,i=1,2...k}
多面集
:由有限个半空间的交组成的集合为多面集
{
x
∣
A
x
<
=
b
}
\{ x | Ax <= b\}
{x∣Ax<=b}
常见于线性规划的可行域
极点
定义:若S为非空凸集,
x
∈
S
x \in S
x∈S, 若由
x
=
λ
x
(
1
)
+
(
1
−
λ
)
x
(
2
)
x = \lambda x^{(1)} + (1 - \lambda) x^{(2)}
x=λx(1)+(1−λ)x(2)必有
x
=
x
(
1
)
=
x
(
2
)
x = x^{(1)} = x^{(2)}
x=x(1)=x(2),则x是S的极点。
任何有界凸集中任意点都可以表示成极点的凸组合。 但是极点不能被其他两点表示。
圆的边缘上的点都是极点。
凸集的方向
:如果凸集中的一个点引出一条射线,这条射线上所有的点仍在凸集内,则称这个射线的方向为回收方向(方向),而这所有的方向全部形成的尖锥称为凸集的回收锥。
方向:设S为
R
n
R^n
Rn中的闭凸集,d为非零向量,如果对S中的每一个
x
x
x ,都有射线
{
x
+
λ
d
∣
λ
>
=
0
}
⊂
S
\{ x + \lambda d | \lambda >= 0\} \subset S
{x+λd∣λ>=0}⊂S则称向量
d
d
d 为S的方向。
极方向
:如果方向
d
d
d 无法由其他两个方向的凸组合得到,那么方向d就是凸锥的极方向。(凸锥组合就是两个方向中夹角的一个方向,向量加法)
性质定理
-
表示定理:
即多面集可以由极点的凸组合和极方向的凸锥组合全部表示出来 -
凸集分离定理
设 S 1 S_1 S1和 S 2 S_2 S2是 R n R^n Rn中两个非空集合, H = { x ∣ p T x = α } H= \{ x | p^T x = \alpha\} H={x∣pTx=α}为超平面, 如果对 ∀ x ∈ S 1 \forall x \in S_1 ∀x∈S1, 都有 p T x > = α p^T x >= \alpha pTx>=α, 对于每个 x ∈ S 2 x \in S_2 x∈S2, 都有 p T x < = α p^T x<= \alpha pTx<=α(或者相反),则称超平面 H H H分离集合 S 1 S_1 S1和 S 2 S_2 S2。
-
闭凸集的一个性质
设 S S S 为 R n R^n Rn中的闭凸
集, y ∉ S y\not \in S y∈S,则存在唯一的点 x ^ ∈ S \hat{x} \in S x^∈S, 使得
∣ ∣ y − x ^ ∣ ∣ = i n f x ∈ S ∣ ∣ y − x ∣ ∣ ||y- \hat{x}|| = inf_{x\in S}||y - x|| ∣∣y−x^∣∣=infx∈S∣∣y−x∣∣
可以找到唯一的一个点使得y到集合S的距离是最小的,且只有到这个点的距离是最小距离
-
点与凸集分离定理
设 S S S是 R n R^n Rn中的非空闭凸集
, y ∉ S y \not \in S y∈S, 则存在非零向量 p p p及数 ξ > 0 \xi > 0 ξ>0, 使得对每一个点 x ∈ S x \in S x∈S, 成立 p T y > = ξ + p T x p^T y >= \xi + p^T x pTy>=ξ+pTx
可以在点和凸集中间找到一个超平面
考虑边界的情况 -
凸集分离定理
设 S 1 S_1 S1 和 S 2 S_2 S2是 R n R^n Rn的两个非空凸集, S 1 ∩ S 2 = ∅ S_1 \cap S_2 = \emptyset S1∩S2=∅, 则存在非零向量 p p p, 使得
i n f { p T ∣ x ∈ S 1 } > = s u p { p T x ∣ x ∈ S 2 } inf \{p^T | x \in S_1 \} >= sup \{ p^T x | x \in S_2\} inf{pT∣x∈S1}>=sup{pTx∣x∈S2}两个交集非空的凸集一定能找到一个超平面将他们分离
-
择一定理
不等式组解的充分必要条件- Farkas定理
设A为m x n矩阵, c为n维向量,则 A x < = 0 , c T x > 0 Ax <= 0, c^T x > 0 Ax<=0,cTx>0有解的充分必要条件是 A T y = c , y > = 0 A^T y = c, y >= 0 ATy=c,y>=0无解。 - Gordan引理
设A为m x n矩阵,那么,Ax < 0 有解的充分条件是不存在非零向量 y >= 0, 使 A T y = 0 A^T y = 0 ATy=0
- Farkas定理
凸函数
凸函数定义:设S是
R
n
R^n
Rn 中的非空凸集,
f
(
x
)
f(x)
f(x) 是定义在S上的实函数,如果对于每一对
x
1
,
x
2
∈
S
x_1, x_2 \in S
x1,x2∈S 及每一个
a
a
a,
0
<
=
a
<
=
1
0 <= a <= 1
0<=a<=1, 都有
f
(
a
x
1
+
(
1
−
a
)
x
2
)
<
=
a
f
(
x
1
)
+
(
1
−
a
)
f
(
x
2
)
f(ax_1 +(1 - a)x_2) <= af(x_1) + (1 - a)f(x_2)
f(ax1+(1−a)x2)<=af(x1)+(1−a)f(x2)
则称函数
f
(
x
)
f(x)
f(x) 为S上的凸函数, 当
<
=
<=
<= 变成 <,则称为严格凸函数。
凸函数性质
- 凸函数的线性组合仍为凸函数
- 截取凸函数连续的一段它的定义域是凸集
- 凸函数的局部极小点是整体极小点
凸函数的判定
一阶充要条件:
设S是
R
n
R^n
Rn 中非空开凸集,
f
(
x
)
f(x)
f(x) 是定义在S上的可微函数, 则
f
(
x
)
f(x)
f(x)为图函数的充要条件是对任意两点
x
(
1
)
x^{(1)}
x(1),
x
(
2
)
∈
S
x^{(2)} \in S
x(2)∈S, 有
f
(
x
(
2
)
)
−
f
(
x
1
)
>
=
▽
f
(
x
(
1
)
)
(
x
(
2
)
−
x
(
1
)
)
f(x^{(2)}) - f(x^{1}) >= \bigtriangledown f(x^{(1)})(x^{(2)} - x^{(1)})
f(x(2))−f(x1)>=▽f(x(1))(x(2)−x(1))
将 > = >= >=改为 > > >就是严格凸
f
(
x
)
f(x)
f(x)是凸函数当且仅当任意点处的切线增量不超过函数增量
二阶充要条件:
设
S
S
S 是
R
n
R^n
Rn 中非空开凸集,
f
(
x
)
f(x)
f(x) 是定义在S上的二次可微
函数,则
f
(
x
)
f(x)
f(x)为凸函数的充要条件是对任意
x
∈
S
x \in S
x∈S,
f
(
x
)
f(x)
f(x) 在x 处的 Hessian矩阵
▽
2
f
(
x
)
\bigtriangledown^2 f(x)
▽2f(x)是半正定的。
对二次函数,
正定为严格凸函数。
半正定为凸函数。