高级优化理论与方法（精华版）

liuzibujian

已于 2024-06-28 10:59:15 修改

阅读量965

点赞数 27

分类专栏：高级优化理论与方法文章标签：线性代数优化理论优化方法算法数学

于 2024-06-26 12:12:35 首次发布

本文链接：https://blog.csdn.net/liuzibujian/article/details/139981122

版权

高级优化理论与方法专栏收录该内容

16 篇文章 1 订阅

订阅专栏

前言

这门课已经结课，马上就要考试了。在这里，我把一个学期的内容都整理一下，方便复习。这里就略过定义等基础内容，只有大致框架及重点内容。

无约束优化问题

必要条件和充分条件

FONC

FONC：一阶必要条件。若 $x^*$ 为最小值点，则 $d^T \nabla f(x^*)\geq0$ 。若 $x^*$ 为内点，则 $d^T\nabla f(x^*)=0$ 。

SONC

SONC：二阶必要条件。若 $x^*$ 为最小值点，且 $d^T\nabla f(x^*)=0$ ，则 $d^T F(x^*)d\geq0$ 。

SOSC

SOSC：二阶充分条件。若 $x^*$ 满足 $\begin{cases} \nabla f(x^*)=0\\ F(x^*)>0 \end{cases}$ ，则 $x^*$ 是局部最小值点。

应用

求无约束优化问题的步骤：
计算 $\nabla f(x)$ 和 $F (x)$ ，找到满足 $\begin{cases} \nabla f(x^*)=0\\ F(x^*)>0 \end{cases}$ 的点 $x^*$ 。

例子

$f(x)=x_1^2+x_2^2$
$\nabla f(x)=[2x_1,2x_2]^T$

$H(x)=\begin{bmatrix} 2 & 0 \\ 0 & 2 \end{bmatrix}>0$

$x^*=[0,0]^T$

算法

一维搜索算法

梯度下降法

公式

$x^{k+1}=x^k-\alpha^k \nabla f(x^k)$ ，其中 $\alpha^k=argmin f(x^k-\alpha^k \nabla f(x^k))$

若 $f (x)$ 为二次函数，即 $f(x)=\frac{1}{2} x^TQx-bx$ ，则 $\alpha^k =\frac{{g^k}^T\cdot g^k}{{g^k}^TQg^k}$ ，其中 $g^k=\nabla f(x^k)=Qx^k-b$

应用

$f(x)=x_1^2+x_2^2 \Rightarrow f(x)=\frac{1}{2} x^TQx-bx$
$Q=\begin{bmatrix} 2&0 \\ 0&2 \end{bmatrix}$

$b=\begin{bmatrix} 0 \\ 0 \end{bmatrix}$

$\nabla f(x)=\begin{bmatrix} 2x_1 \\ 2x_2 \end{bmatrix}$

$F(x)=\begin{bmatrix} 2&0 \\ 0&2 \end{bmatrix}$

$x^0=\begin{bmatrix} 1 \\ 1 \end{bmatrix}$

$x^{k+1}=x^k-\alpha^kg^k$

$x^1=x^0-\alpha^0g^0$

$g^0=\nabla f(x^0)=\begin{bmatrix} 2 \\ 2 \end{bmatrix}$

$\alpha^0=\frac{{g^0}^Tg^0}{{g^0}^TQg^0}=\frac{8}{[4,4]\cdot [2,2]^T}=\frac{8}{16}=\frac{1}{2}$

$x^1=[1,1]^T-\frac{1}{2}[2,2]^T=[0,0]^T$

$g^1=\nabla f(x^1)=\begin{bmatrix} 0 \\ 0 \end{bmatrix}$

牛顿法

一元函数： $x^{k+1}=x^k-\frac{f'(x^k)}{f''(x^k)}$

多元函数： $x^{k+1}=x^k-[F(x^k)]^{-1}\nabla f(x^k)$

针对二次函数的算法

共轭方向法

公式

二次函数情形下：
$x^{k+1}=x^k-\alpha^k \nabla f(x^k)$

$g^k=\nabla f(x^k)=Qx^k-b$

$\alpha^k=-\frac{{g^k}^Td_k}{d_k^TQd_k}$

$x^{k+1}=x^k+\alpha^kd_k$
其中 $d_0,d_1,\cdots,d_n$ 是一组共轭方向向量。

应用

求 $f(x)=\frac{1}{2}x^T\begin{bmatrix} 4&2 \\ 2&2 \end{bmatrix}x-[-1,1]x$ 的最小值。

$g(x)=\begin{bmatrix} 4&2 \\ 2&2 \end{bmatrix}x-\begin{bmatrix} -1 \\ 1 \end{bmatrix}$

选取 $x^0=\begin{bmatrix} 0 \\ 0 \end{bmatrix}$

选取 $d_0=\begin{bmatrix} 1 \\ 0 \end{bmatrix}$

$d^T_0\begin{bmatrix} 4&2 \\ 2&2 \end{bmatrix}d_1=0\Rightarrow \begin{bmatrix} 4\\ 2 \end{bmatrix}d_1=0$

选取 $d_1=\begin{bmatrix} -\frac{3}{8} \\ \frac{3}{4} \end{bmatrix}$

$g^0=\begin{bmatrix} 1 \\ -1 \end{bmatrix}$

$\alpha^0=\frac{-{g^0}^Td_0}{d_0^TQd_0}=\frac{-[1,-1]\begin{bmatrix} 1 \\ 0 \end{bmatrix}}{[1,0]\begin{bmatrix} 4&2 \\ 2&2 \end{bmatrix}\begin{bmatrix} 1 \\ 0 \end{bmatrix}}=-\frac{1}{4}$

$x^1=x^0+\alpha^0d_0=\begin{bmatrix} -\frac{1}{4} \\ 0 \end{bmatrix}$

$g^1=\begin{bmatrix} 0 \\ -\frac{3}{2} \end{bmatrix}$

$\alpha^1=2$

$x^2=\begin{bmatrix} -1 \\ \frac{3}{2} \end{bmatrix}$

$f(x^2)=0$

共轭梯度法

输入: $f(x)=\frac{1}{2}x^TQx-b^Tx, x^0$

$k = 0$
compute $g^0=\nabla f(x^0)$ , If $g^0=0$ , then stop; else $d_0=-g^0$
$\alpha^k=-\frac{{g^k}^Td_k}{{d_k}^TQd_k}$
$x^{k+1}=x^k+\alpha^kd_k$
$g^{k+1}=\nabla f(x^{k+1})$ , If $g^{k+1}=0$ then stop;
$\beta^k=\frac{{g^{k+1}}^TQd_k}{{d_k}^TQd_k}$
$d^{k+1}=-g^{k+1}+\beta^kd_k$
$k$ ++, goto 3

条件优化问题

线性规划

形式

min/max $f(x)=c^Tx=\sum_{i=1}^nc_ix_{ij}, c\in \mathbb{R}^n, x \in \mathbb{R}^n$
s.t. $\begin{cases} a_{11}x_1+\cdots+a_{1n}x_n>b_1\\ a_{21}x_1+\cdots+a_{2n}x_n\leq b_2\\ \cdots\\ a_{m1}x_1+\cdots+a_{mn}x_n\geq b_m \end{cases}$
$b_i\in\mathbb{R},\forall 1\leq i\leq m$
$a_{ij}\in\mathbb{R}, \forall 1\leq i\leq n, 1\leq j\leq m$

单纯形法

算法

Simplex: Given an initial basis B

Compute: $[A,b]=[B,D,b]\rightarrow [I,Y,y_0]$
Compute: $\forall m+1\leq j\leq n: r_j=c_j-z_j$
If $\forall j: r_j\geq 0$ , then return $x=[y_0^T,0]^T$
else pick an $q$ with $r_q<0$
If no $y_{iq}>0$ for $1\leq i\leq m$ , then return “no solution”
else $p=argmin\{\frac{y_{i0}}{y_{iq}}:y_{iq}>0\}$
Update $I,Y,y_0]$ , goto 2

应用

max $7x_1+6x_2$
s.t. $2x_1+x_2\leq 3$
$x_1+4x_2\leq 4$
$x_1,x_2\geq 0$

$\Rightarrow$ min $7x_1-6x_2$
s.t. $2x_1+x_2+x_3=3$
$x_1+4x_2+x_4=4$
$x_1,x_2,x_3,x_4\geq 0$

$\begin{bmatrix} A&b\\ c^T&0 \end{bmatrix}=\begin{bmatrix} 2&1&1&0&3\\ 1&4&0&1&4\\ -7&-6&0&0&0 \end{bmatrix}$

$B=[a_3,a_4]$

$x=\begin{bmatrix} 0\\ 0\\ 3\\ 4 \end{bmatrix}$

$r_B^T=[-7,-6]\Rightarrow q=1$

$z_0=0$

$p=argmin\{\frac{y_{i0}}{y_{iq}}:y_{iq}>0\}$
$\frac{3}{2}$ v.s. $\frac{4}{1}\Rightarrow p=1$

$B'=[a_1,a_4]$

$\begin{bmatrix} 1&\frac{1}{2}&\frac{1}{2}&0&\frac{3}{2}\\ 0&3\frac{1}{2}&-\frac{1}{2}&1&\frac{5}{2}\\ 0&-\frac{5}{2}&\frac{7}{2}&0&\frac{21}{2} \end{bmatrix}$

$x=[\frac{3}{2},0,0,\frac{5}{2}]^T$

$z_0=-\frac{21}{2}$

$r_D^T=[-\frac{5}{2},\frac{7}{2}]\Rightarrow q=2$

$\frac{y_{i0}}{y_{iq}}: \frac{\frac{3}{2}}{\frac{1}{2}}=3$ v.s. $\frac{\frac{5}{2}}{\frac{7}{2}}=\frac{5}{7}\Rightarrow p=2$

$\begin{bmatrix} 1&0&\frac{4}{7}&-\frac{1}{7}&\frac{8}{7}\\ 0&1&-\frac{1}{7}&\frac{2}{7}&\frac{5}{7}\\ 0&0&\frac{22}{7}&\frac{5}{7}&\frac{86}{7} \end{bmatrix}$

$B=[a_1,a_2],x=[\frac{8}{7},\frac{5}{7},0,0]^T,z=-\frac{86}{7},r_D^T=[\frac{22}{7},\frac{5}{7}]\geq 0$

$x$ 达到最优 !

非线性条件优化问题

约束条件只有等式的情形

min $f (x) = 0$
s.t. $h (x) = 0$

拉格朗日条件

公式

拉格朗日函数： $l(x,\lambda)=f(x)+\lambda^Th(x)$

$Dl(x^*,\lambda^*)=0\Rightarrow \begin{cases} D_xl(x^*,\lambda^*)=0\\ D_{\lambda}l(x^*,\lambda^*)=0 \end{cases}$

应用

已知长方体的表面积为 $A$ ，求体积的最大值。
max $x_1x_2x_3$
s.t. $x_1x_2+x_2x_3+x_1x_3=\frac{A}{2}(A>0)$
$f(x)=-x_1x_2x_3,h(x)=x_1x_2+x_2x_3+x_1x_3-\frac{A}{2}$
$\nabla f(x)=[-x_2x_3,-x_1x_3,-x_1x_2]^T$
$\nabla h(x)=[x_2+x_3,x_1+x_3,x_1+x_2]^T$
All feasible solutions are regular.
$\lambda\in\mathbb{R}$
$\begin{cases} \nabla f(x)+\lambda \nabla h(x)=0\\ h(x)=0 \end{cases}\Rightarrow \begin{cases} x_2x_3-\lambda(x_2+x_3)=0\\ x_1x_3-\lambda(x_1+x_3)=0\\ x_1x_2-\lambda(x_1+x_2)=0\\ x_1x_2+x_2x_3+x_1x_3-\frac{A}{2}=0 \end{cases}$

当 $x_1=x_2=x_3=\sqrt{\frac{A}{6}}$ 时，取到最值

约束条件包含不等式的情形

min $f (x)$
s.t. $h (x) = 0$
$g(x)\leq 0$

KKT条件

公式

$\mu^*\geq 0$
$Df(x^*)+{\lambda^*}^TDh(x^*)+{\mu^*}^TDg(x^*)=0$
${\mu^*}^Tg(x^*)=0$

应用

min $-\frac{400R}{(10+R)^2}$
s.t. $-R\leq 0$

$\nabla f(R)=-\frac{400(10-R)}{(10+R)^3}$

$\begin{cases} \mu\geq 0\\ Df(x^*)+{\lambda^*}^TDh(x^*)+{\mu^*}^TDg(x^*)=0\\ \mu^T g(x)=0\\ g(x)\leq 0\\ h(x)=0 \end{cases}$

$\Rightarrow \begin{cases} \mu\geq 0\\ -\frac{400(10-R)}{(10+R)^3}-\mu=0\\ \mu R=0\\ R\geq 0 \end{cases}$

If $\mu>0$ , then $R=0,\mu=-4$ （✕）
If $\mu=0\Rightarrow R=10$ （✓ ）

考试押题

一共五道大题，我也押五道题。

FONC,SONC,SOSC的应用。
梯度下降法。
共轭方向法。
单纯形法。
KKT条件。

总结

我把这个学期讲的重点全部整理在这里了。其实这门课程的内容非常多，其中包括了很多难度比较大的内容，以及为了知识体系的完整性补充的内容，那些内容这里全都没有放上来。这里只挑选了一些难度不大，讲解较为详细，应用较广的内容。也祝所有选这门课的同学考高分！

liuzibujian

关注

27
点赞
踩
23

收藏

觉得还不错? 一键收藏
2
评论
高级优化理论与方法（精华版）

我把这个学期讲的重点全部整理在这里了。其实这门课程的内容非常多，其中包括了很多难度比较大的内容，以及为了知识体系的完整性补充的内容，那些内容这里全都没有放上来。这里只挑选了一些难度不大，讲解较为详细，应用较广的内容。也祝所有选这门课的同学考高分！
复制链接

扫一扫

专栏目录