高级优化理论与方法（八）

liuzibujian

于 2024-04-15 11:00:18 发布

阅读量1k

点赞数 25

分类专栏：高级优化理论与方法文章标签：优化理论优化方法数学算法模拟退火算法

本文链接：https://blog.csdn.net/liuzibujian/article/details/137764005

版权

高级优化理论与方法专栏收录该内容

16 篇文章 1 订阅

订阅专栏

Global Search Method

之前的方法都需要用到函数Gradient，并且要求用户自己给出初始点 $x_0$ 。接下来介绍几种不一样的启发式算法。

Neler-Mead Simplex

Def: “Simplex” $\mathbb{R}^n$
Object determined by an assemby of $n + 1$ points.

$det\begin{bmatrix} P_0&P_1&\cdots &P_n \\ 1&1&\cdots &1 \end{bmatrix}\neq 0$

Initialize: $P_0,\cdots,P_n\in \mathbb{R}^n$
( $P_i=P_0+\alpha_i e_i, \alpha_i\in \mathbb{R}, e_i=\begin{bmatrix} 0\\ \cdots \\ 0\\ 1\\ 0\\ \cdots \\ 0 \end{bmatrix})$
注：上面给出了一种可行的初始化方法， $e_i$ 表示只有第 $i$ 维为1，其余都为0的 $n$ 维向量。

Update: replace $P_i$ with the max $f(P_i)$ by a new point.

Termination conditions satisfied.

2-dimensional: $P_s, P_{nl}, P_l: f(P_s)\leq f(P_{nl})\leq f(P_l)$

注：二维情况下，有三个初始点，将三个初始点按照大小关系排列产生 $P_s, P_{nl}, P_l$ 。

$f(P_0)\leq f(P_1)\leq \cdots \leq f(P_n)$

$P_g=\frac{1}{n} \sum_{i=0}^{n-1} P_i$

$P_r=P_g+\rho (P_g-P_l)$ [typical: $\rho=1$ ]

接下来都是以二维情况举例，进行分类讨论。

Case 1

$f(P_s)\leq f(P_r)\leq f(P_{nl})$

replace $P_l$ by $P_r\rightarrow$ next iteration

Case 2

$f(P_r)<f(P_s)$

expansion: $P_e=P_g+\lambda (P_g-P_l)$ [ $\lambda=2$ ]

Case 2.1

$f(P_e)\leq f(P_r)$

replace $P_l$ by $P_e$

Case 2.2

otherwise
replace $P_l$ by $P_r$

Case 3

$f(P_r)>f(P_{nl})$

Case 3.1

$f(P_l)>f(P_r): P_c=P_g+r(P_r-P_g)$ [ $r=\frac{1}{2}$ ]

Case 3.2

otherwise
$P_c=P_g+r(P_l-P_g)$ [ $r=\frac{1}{2}$ ]
If $f(P_c)<f(P_l)$ then replace $P_l$ by $P_c$ , next iteration.
Otherwise, shrinkage: $\forall i: V_i=\delta (P_l-P_s)$ [ $\delta=\frac{1}{2}$ ]

Simulated Annealing

模拟退火算法是一种随机搜索（Randomized Search) 算法。

Def: “Neighborhood” of $x$ : $N_{\epsilon}(x)=\{x': d(x,x')\leq \epsilon\}$

Naive Random Search

$k := 0$ , initialize $x^0$
Pick a point $z^k$ at random from $N_{\epsilon}(x^k)$
If $f(z^k)<f(x^k)$ , then $x^{k+1}=z^k$ ; else $x^{k+1}=x^k$
If some stop criterium satisfied, then stop
$k$ ++; Goto 2

Problem: local optimum
way: enlarge $N_{\epsilon}(x)$

Simulated Annealing

Toss coin with probability of HEAD equal to $p(k,f(x^k),f(z^k))$ . If HEAD, then $x^{k+1}=z^k$ ; else $x^{k+1}=x^k$

$P(k,f(x^k),f(z^k))=min\{1,exp(-\frac{f(z^k)-f(x^k)}{T_k})\}$

where $T_k$ is a positive sequence.

$T_k=\frac{r}{log(k+2)}, r>0$
monotonically decreased to 0.

$\begin{cases} f(z^k<f(x^k): x^{k+1}=z^k(概率为1) \\ f(z^k)\geq f(x^k): x^{k+1}=z^k (概率为exp(-\frac{f(z^k)-f(x^k)}{T_k})) \end{cases}$

$k\to \infty$ : “escape” probability decreased.
注：该方法通过抛硬币的方式，解决了朴素随机搜索中可能陷入局部最小值的问题。

Particle Swarm Optimization (PSO)

粒子群优化

$∣ P ∣ = m$

$\forall i: p_i^{best}$

$g^{best}$ : globally best

basic PSO

$k := 0$ , generate initial random points. $p_i^0,v_i^0>p_i^{best}=p_i^0, g^{best}=argmin_i f(p_i^0)$
For $i=1,\cdots,m$ generate random vectors $r_i^k, s_i^k$ with components from {0,1}, and set $\omega<1,c_1,c_2\approx2\Rightarrow V_i^{k+1}=\omega V_i^k+c_1r_i^k(p_i^{best,k}-p_i^k)+c_2s_i^k(g^{best,k}-p_i^k), p_i^{k+1}=p_i^k+V_i^{k+1}$
For $i=1,\cdots,m$ do: if $f(p_i^{k+1})<f(p_i^{best,k})$ , then $p_i^{best,k+1}=p_i^{k+1}$ ; else $p_i^{best,k+1}=p_i^{best,k}$
If $\exist i\in \{1,\cdots,m\}$ with $f(p_i^{k+1})<f(g^{best,k})$ then $g^{best,k+1}=p_i^{k+1}$ ; else $g^{best,k+1}=g^{best,k}$
If some stop criterion satisfied then stop;
$k$ ++; goto 2

Genetic Algorithms

遗传算法

representation scheme: ①selection②cross over③mutation

算法流程：

$P_0$
Selection $\rightarrow M_k$
Cross Over
Mutation
If some stop criterion satisfied then stop;
goto 2

为了表述方便，这里假定求最大值而非最小值。

Selection

population set: $∣ P (k) ∣ = N$

$P(k)=\{x_1,\cdots,x_N\}$

$∣ M (k) ∣ = N$

注：Selection的目的是从大小为N的population set（即 $P$ ）中选出N个元素组成 $M$ 。

Rouletle-Wheel

$Prob(x_i\to M(k))=\frac{f(x_i)}{F(k)}, F(k)=\sum_{i=1}^N f(x_i)$

Tournament Scheme

随机两个元素 $x_i,x_j$ ，若 $f(x_i)>f(x_j)$ ，则选取 $x_i$ 进入 $M$

Cross Over

随机两个元素 $x_i,x_j$ ，将 $x_i$ 的前半部分和 $x_j$ 的后半部分结合，形成新的元素。

Mutation

以较低的概率对元素 $x_i$ 的某一位进行变异。

Constrained Optimization

min $f (x)$
s.t. $x\in \Omega$

Linear Programming(LP)

min/max $f(x)=c^Tx=\sum_{i=1}^nc_ix_{ij}, c\in \mathbb{R}^n, x \in \mathbb{R}^n$
s.t. $\begin{cases} a_{11}x_1+\cdots+a_{1n}x_n>b_1\\ a_{21}x_1+\cdots+a_{2n}x_n\leq b_2\\ \cdots\\ a_{m1}x_1+\cdots+a_{mn}x_n\geq b_m \end{cases}$
$b_i\in\mathbb{R},\forall 1\leq i\leq m$
$a_{ij}\in\mathbb{R}, \forall 1\leq i\leq n, 1\leq j\leq m$

Complex

LP Standtard Form

min $c^Tx$
s.t. $Ax\geq b$

Normal Form

min $c^Tx$
s.t. $A x = b$
$x\geq 0$
注：为了满足 $x\geq0$ ，若 $x_i$ 的要求是小于等于0，则可以用 $x_i$ 来代替 $x_i$ ；若 $x_i$ 没有要求，则可以令 $x_i=u-v,u,v\geq0$ 。

Example

max $x_2-x_1$
s.t. $3x_1=x_2-5$
$|x_2|\leq 2$
$x_1\leq 0$

①min $x_1-x_2$
② $x_1\leftarrow-x_1$
③ $|x_2|\leq2\Rightarrow x_2\leq 2, x_2\geq -2$
④ $x_2=u-v,u,v\geq 0$

min $x_1-(u-v)$
s.t. $3x_1=u-v-5$
$u-v\leq 2$
$u-v\geq2$
$x_1,u,v\geq0$

min $x_1-u+v$
s.t. $3x_1+u-v=5$
$u - v + y = 2$
$u - v - z = - 2$
$x_1,u,v,y,z\geq0$

Theorem

For each LP, there exists an equivalent LP in normal form.

总结

这节课先介绍了一些全局搜索法。介绍了奈勒-米德单纯形算法，模拟退火算法，粒子群优化算法，遗传算法（这里讲的比较粗略，可以参考我的另一篇博客）。这些算法都属于启发式算法，算法的理论基础较为薄弱，所以在介绍算法之后没有做过多展开。

到这周是第八周了，学期过半。前半学期都在介绍无限制条件的优化算法，后半学期要开始介绍带限制条件的优化算法了。这节课先从比较简单的线性优化开始，介绍单纯形法。这节课证明了任何线性优化问题都可以转化为规范形式，这方便了我们后面的求解。

liuzibujian

关注

25
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
高级优化理论与方法（八）

这节课先介绍了一些全局搜索法。介绍了奈勒-米德单纯形算法，模拟退火算法，粒子群优化算法，遗传算法（这里讲的比较粗略，可以参考我的另一篇博客）。这些算法都属于启发式算法，算法的理论基础较为薄弱，所以在介绍算法之后没有做过多展开。到这周是第八周了，学期过半。前半学期都在介绍无限制条件的优化算法，后半学期要开始介绍带限制条件的优化算法了。这节课先从比较简单的线性优化开始，介绍单纯形法。这节课证明了任何线性优化问题都可以转化为规范形式，这方便了我们后面的求解。
复制链接

扫一扫