【凸优化】凸分析、非线性规划理论与标准算法

最新推荐文章于 2024-10-01 04:50:10 发布

我单手_拿大顶

最新推荐文章于 2024-10-01 04:50:10 发布

阅读量1.8k

点赞数 32

分类专栏：大二上 · 笔记文章标签：算法学习笔记

本文链接：https://blog.csdn.net/g_guts_/article/details/133553413

版权

大二上 · 笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

这学期上了李英红老师的凸优化，老师每堂课都写满黑板好几轮，激情澎湃地讲完3个45分钟。作为一个电子信息专业的学生，我选择上这门课完全是出于兴趣，能够得到老师这么认真的对待，实在非常感动且感激。
这篇笔记是教材1章的内容，在国庆假期期间整理的。后来时间紧，自己的效率也不高，忙培养方案内课程，这门课就没再整理博客。但期末复习它还是耗费了我很大的精力，一千余小时，最终只考了84分。最后一节课上考完试，我把复习资料拿去给老师签字，算是弥补了一些小小的遗憾。
整理草稿箱看到了这篇，觉得不如发出来。

1.引言

一、MP: 数学规划
$\ f(x)\\h_i(x) = 0, i=1,...,m\\g_j(x) \leq 0, j=1,...,k\,$

约束：等式约束h_i、不等式约束g_j
定义域：X ∈ Rⁿ，x = (x₁,x₂,…,x_n)为列向量（与系数矩阵相乘时），列向量中元素称为决策变量。
可行域：定义域+约束
$\cap \{ x \in R^n : h_i(x) = 0, i=1,..,m,g_j(x) \leq 0,j=1,...,k \},$

二、基本概念

全局极小点：表示为 $x_*$ ， $f(x_*) \leq f(x)$ 。可能没有，比如 $\tfrac{1}{x}$ 。
下确界： $f_*=inf \{f(x):x \in S \}$ ，即使无全局极小点，下确界依然可以有限。
局部极小点：定义欧氏球如下： $B(x_*,r)=\{x \in R^n:||x-x_*||_2<r\}$ 。局部极小点定义为：点 $x_*\in S$ 且存在某 $r > 0$ ，使得对所有的 $x\in S \cap B(x_*,r)$ 有 $f(x_*) \leq f(x)$ 成立。全局极小点一定是局部极小点，反之不一定成立。
这是一个讲解范数的链接
 这是另一个链接
规划们

线性规划	无约束优化	离散优化	连续优化
$\ f(x)=c_1x_1+c_2x_2+...+c_nx_n \equiv \textbf{c}^T\textbf{x}\\X\in S=\{x\in R^n:a_i^Tx \leq b_i,i=1,...,m\}\\\textbf{Ax} \leq \textbf{b}$ 其中 $\textbf{A}$ 为 $m * n$ 矩阵，第i行是 $a_i^T$	$S=R^n$	定义域 $X$ 是离散集	$S$ 连续，比如 $R^n$ 、 $\{x \in R^n:a \leq x \leq b\})$ 、单纯形_{（没看懂什么是单纯形，是指const吗？）}

2.凸集

2.1 定义和性质

定义

（1）一般： $\textbf{x},\textbf{y} \in X \rightarrow (1-\theta)\textbf{x}+\theta \textbf{y} \in X\ \forall\theta\in [0,1]$
（2）特殊：单点集 ${x\}$ 和 $\emptyset$ 都是凸集

更多例子

超平面：
（1）定义： $w^Tx+b=0$ （教材上写作： $s^Tx=c$ ，可知关系 $w = s$ 、 $b = - c$ ）。
对超平面定义的理解：

$\textbf{w}$	$\textbf{x}$	$\textbf{b}$
超平面的法向量，一个n维列向量， $w=(w_1,w_2,...w_n)^T$ 。其指向的方向为超平面的正面，反向为反面。 $正面：w^Tx+b>0\\反面：w^Tx+b<0\\超平面上：w^Tx+b=0$	组成超平面的点集， $x=(x_1,x_2,...,x_n)^T$ ，可以理解为，超平面就是由一堆n维空间中的点，组成的n-1维的仿射子空间（与线性子空间区分，见表格下注^[1]），本质为自由度比向量空间小1。	一个常数。几何意义：超平面到原点的距离。推导过程见表下。

注^[1]：线性空间V的线性子空间为关于自身运算封闭的非空子集，对线性运算封闭： $k\in R,\textbf{v}\in V,k\textbf{v}\in V$ ，当 $k = 0$ 时一定过原点。而仿射子空间可以看作线性子空间平移某向量 $\textbf{a}$ 的结果，不一定过原点。比如超平面就不一定过原点，而当 $w^Tx+b=0$ 中 $b = 0$ 时，才过原点。此时超平面为凸锥。(仿射集在很近的后面会提到)
我在查阅资料的过程中，看到有的文章说超平面过原点，感觉和b的几何意义矛盾，翻了评论才明白线性子空间和仿射子空间的区别。

（2）理解：在n维空间中，给出一个超平面，其上点组成点集 $I(x_1,x_2,...,x_n)$ ，给出超平面上一已知点 $P$ 及超平面法向量 $\textbf{n}$ ，则有： $\textbf{n}(I-P)=0$
可变化为： $\textbf{n}I=\textbf{n}P=const$ ， $\textbf{n}=\textbf{w}^T$

（3）样本空间中点到超平面的距离公式：
$distance=\dfrac{|w^Tx+b|}{||w||}$
推导：
超平面上满足 $w^Tx+b=0$ ，若 $x_0$ 也为超平面上一点，则有 $w^Tx_0+b=0$ 。向量 $x-x_0)$ 在法向量方向上的投影为： $d=\dfrac{|w^T(x-x_0)|}{||w||}$ 内积的几何意义用途：（1）求夹角（2）求对方方向上投影
因为 $w^Tx_0=-b$ ，故 $w^T(x-x_0)=w^Tx+b$ ，得证。
当 $x_0$ 为原点时，？？

半空间： $H^+=\{x\in R^n:s^Tx \geq c\}\\ H^-=\{x \in R^n:s^Tx \leq c\}$
多面体： $\{\textbf{x}\in R^n:\textbf{Ax} \leq \textbf{b}\}$ 有限个半空间的交集 $\rightarrow$ 有限个凸集的交还是凸集。
范数单位球： $\forall \textbf{a}\in R^n$ ， $\{\textbf{x}\in R^n:||\textbf{x - a}||<r\}$ 为凸的。
二范数单位球？？
区分多维椭球与番薯单位球的意义？？？
```
 范数：
 定义
 性质
 （1）正齐次性
 （2）三角不等式
```
椭球：
我对椭球的理解就是，每个维度的变量的平方和。如果等式右侧常数恰好为1，且左侧各平方系数相等，两边同时开方，可以得到2范数单位球。
凸集的 $\epsilon$ -领域

这部分的作业题目以及解答如下图：

判断给出集合凸性

凸组合与凸包

凸组合： $\in N^+$ ，点 $x_1,...,x_k\in R^n$ 的凸组合是系数非负且系数之和为1的线性组合： $\sum_{i=1}^{k} \theta_i x_i$
凸集的内表示（凸集的一种刻画）：集合 $X\subsetneq R^n$ 凸当且仅当关于取凸组合的运算封闭。
凸包：
（1）从外部刻画：包含 $X$ 的最小凸集是 $X$ 的凸包，记作 $co n v X$ 。
（2）从内部刻画：由凸组合得到凸包 $\rightarrow$ 凸包是所有凸组合组成的集合。 $convX=\hat{X}=\{ \sum_{i=1}^{k} \theta_i \textbf{x}_i: \forall k \in Z_{++},\textbf{x}_i \in X,\theta_i \geq 0\ \forall i,\sum_{i} \theta_i =1\}$
证明：（证明两个集合相等==证它们相互包含）
$\hat{X}\subseteq convX$ ：包含 $X$ 的集合必然包含 $X$ 的点得到的凸组合，易证。
$\subseteq \hat{X}$ ：先后运用凸组合和凸集的定义证明 $\hat{X}$ 的凸性。
推论： $X$ 凸当且仅当 $co n v X = X$