最优化理论复习--凸集与凸函数

ˇasushiro

已于 2023-12-20 22:02:22 修改

阅读量2.8k

点赞数 30

分类专栏：最优化理论文章标签：人工智能

于 2023-12-05 14:54:26 首次发布

本文链接：https://blog.csdn.net/m0_64372178/article/details/134780839

版权

最优化理论专栏收录该内容

10 篇文章

订阅专栏

文章目录

基本概念
凸集
凸函数
下一篇

基本概念

可行点（可行解）：在规划问题中，满足约束条件的点
可行集或可行域：全体可行点组成的集合
无约束问题：如果一个问题的可行集是整个空间。

分为三种情况：

$\emptyset, 则称该问题无解或不可行$
$\not = \emptyset, 但是目标函数在S上无界$
$\not = \emptyset 且目标函数有限的最优解，则称问题有最优解$

符号问题：
$x\in R^n$ 表示 $x$ 是向量
$\in R$ 表示 $x$ 是实数
黑体的是向量
没有加粗的是数

凸集

凸集定义：设S为n维欧式空间 $R^n$ 中的一个集合。若对任意两点 $x^{(1)}, x^{(2)} \in S$ 及每个实数 $\lambda \in [0, 1]$ 有
$\lambda * x^{(1)} + (1 - \lambda) * x^{(2)} \in S$
则称S为凸集。 $\lambda * x^{(1)} + (1 - \lambda) * x^{(2)}$ 称为 $x^{(1)}$ 和 $x^{(2)}$ 的凸组合。

凸组合定义：给定m个向量， $x^1, x^2,...,x^m \in R^n$ ，以及满足 $\sum{\lambda_i = 1}$ 的非负实数 $\lambda_i \in R$ , 称向量 $\lambda_1 x^1 + \lambda_2 x^2 + ... + \lambda_m x^m$ 为 $x$ 的凸组合。
根据向量知识凸组合形成的集合图形为两顶点之间的连线

定理：如果S为凸集那么其中具有任意有限元素的凸组合。

凸集性质：

凸集放大 $\alpha$ 倍仍为凸集
凸集相交仍为凸集
凸集的元素求和仍为凸集
凸集的元素相减仍为凸集

凸包定义：凸包，给定一堆点，这堆点的凸包就是包含这些点的最小凸集。
这些点称为单纯形的顶点。

闭包：

闭集的闭包就是它本身
开集的闭包就是它本身加上它的边界集

凸锥定义：设有集合 $C\subset R^n$ , 若对每一点 $\in C$ ,当 $\lambda$ 取任何非负数时，都有 $\lambda x \in C$ , 称C为锥，如果C为凸集，则称C为凸锥。

从零点到x延长线上的点仍在集合C中
在这里插入图片描述

最优化理论与算法课程-西南科技大学

凸锥组合：
$\{\sum{\lambda_i \alpha^{(i)}} | \lambda_i >= 0, i = 1, 2 ...k\}$

多面集：由有限个半空间的交组成的集合为多面集
${ x | Ax <= b\}$
常见于线性规划的可行域
在这里插入图片描述

极点定义：若S为非空凸集， $\in S$ , 若由 $\lambda x^{(1)} + (1 - \lambda) x^{(2)}$ 必有 $x = x^{(1)} = x^{(2)}$ ，则x是S的极点。
任何有界凸集中任意点都可以表示成极点的凸组合。但是极点不能被其他两点表示。
圆的边缘上的点都是极点。
在这里插入图片描述

凸集的方向：如果凸集中的一个点引出一条射线，这条射线上所有的点仍在凸集内，则称这个射线的方向为回收方向（方向），而这所有的方向全部形成的尖锥称为凸集的回收锥。

在这里插入图片描述

方向：设S为 $R^n$ 中的闭凸集，d为非零向量，如果对S中的每一个 $x$ ,都有射线 $\{ x + \lambda d | \lambda >= 0\} \subset S$ 则称向量 $d$ 为S的方向。

极方向：如果方向 $d$ 无法由其他两个方向的凸组合得到，那么方向d就是凸锥的极方向。（凸锥组合就是两个方向中夹角的一个方向，向量加法）

性质定理

表示定理：

即多面集可以由极点的凸组合和极方向的凸锥组合全部表示出来
凸集分离定理
设 $S_1$ 和 $S_2$ 是 $R^n$ 中两个非空集合， $\{ x | p^T x = \alpha\}$ 为超平面，如果对 $\forall x \in S_1$ , 都有 $p^T x >= \alpha$ , 对于每个 $\in S_2$ , 都有 $p^T x<= \alpha$ （或者相反），则称超平面 $H$ 分离集合 $S_1$ 和 $S_2$ 。
闭凸集的一个性质
设 $S$ 为 $R^n$ 中的闭凸集， $y\not \in S$ ,则存在唯一的点 $\hat{x} \in S$ , 使得
$\hat{x}|| = inf_{x\in S}||y - x||$
可以找到唯一的一个点使得y到集合S的距离是最小的，且只有到这个点的距离是最小距离
点与凸集分离定理
设 $S$ 是 $R^n$ 中的非空闭凸集， $\not \in S$ , 则存在非零向量 $p$ 及数 $\xi > 0$ , 使得对每一个点 $\in S$ , 成立 $p^T y >= \xi + p^T x$

可以在点和凸集中间找到一个超平面

考虑边界的情况
凸集分离定理
设 $S_1$ 和 $S_2$ 是 $R^n$ 的两个非空凸集， $S_1 \cap S_2 = \emptyset$ , 则存在非零向量 $p$ , 使得
$\{p^T | x \in S_1 \} >= sup \{ p^T x | x \in S_2\}$

两个交集非空的凸集一定能找到一个超平面将他们分离
择一定理
不等式组解的充分必要条件
- Farkas定理
  设A为m x n矩阵， c为n维向量，则 $Ax <= 0, c^T x > 0$ 有解的充分必要条件是 $A^T y = c, y >= 0$ 无解。
- Gordan引理
  设A为m x n矩阵，那么，Ax < 0 有解的充分条件是不存在非零向量 y >= 0, 使 $A^T y = 0$

凸函数

凸函数定义：设S是 $R^n$ 中的非空凸集， $f (x)$ 是定义在S上的实函数，如果对于每一对 $x_1, x_2 \in S$ 及每一个 $a$ , $0 < = a < = 1$ , 都有
$f(ax_1 +(1 - a)x_2) <= af(x_1) + (1 - a)f(x_2)$
则称函数 $f (x)$ 为S上的凸函数，当 $< =$ 变成 <,则称为严格凸函数。

在这里插入图片描述

凸函数性质

凸函数的线性组合仍为凸函数
截取凸函数连续的一段它的定义域是凸集
凸函数的局部极小点是整体极小点

在这里插入图片描述
凸函数的判定
一阶充要条件：
设S是 $R^n$ 中非空开凸集， $f (x)$ 是定义在S上的可微函数，则 $f (x)$ 为图函数的充要条件是对任意两点 $x^{(1)}$ , $x^{(2)} \in S$ , 有
$f(x^{(2)}) - f(x^{1}) >= \bigtriangledown f(x^{(1)})(x^{(2)} - x^{(1)})$

将 $> =$ 改为 $>$ 就是严格凸

在这里插入图片描述
$f (x)$ 是凸函数当且仅当任意点处的切线增量不超过函数增量

二阶充要条件：
设 $S$ 是 $R^n$ 中非空开凸集， $f (x)$ 是定义在S上的二次可微函数，则 $f (x)$ 为凸函数的充要条件是对任意 $\in S$ , $f (x)$ 在x 处的 Hessian矩阵 $\bigtriangledown^2 f(x)$ 是半正定的。
对二次函数，
正定为严格凸函数。
半正定为凸函数。
在这里插入图片描述