模拟退火算法（一）：基础篇

最新推荐文章于 2024-08-12 11:55:07 发布

梅菜扣肉林

最新推荐文章于 2024-08-12 11:55:07 发布

阅读量4.3k

点赞数 11

分类专栏：数学建模

本文链接：https://blog.csdn.net/linshuxian315/article/details/106342730

版权

数学建模专栏收录该内容

21 篇文章 56 订阅

订阅专栏

模拟退火算法

提出问题
青铜级别解法（盲目搜索）
王者级别解法（启发式搜索）
操作方法
- 需要研究的地方

提出问题

（1）求一个给定函数的最值问题
eg：求函数 $y = 11 s i n x + 7 c o s (5 x)$ 在[-3,3]内的最大值
第一反应：暴力搜索？啊…这…如果有30个变量怎么办？

（2）TSP（旅行商问题）
eg：一个售货员必须访问n个城市，这n个城市是一个完全图，售货员需要恰好访问所有城市的一次，并且得到最终的城市。城市与城市之间有一个旅行费用，售货员希望旅行费用最少。
完全图：完全图是一个简单的无向图，其中每对不同的顶点之间都恰有一条边框相连。
在这里插入图片描述 （3）书店买书问题（假设有m个书店，n本书，那么买书的方案有mⁿ种）
某同学要从六家线上商城选购5本书籍B₁，B₂，B₃，B₄，B₅，每本书籍在不同商家的售价及其每个商家的单次运费险如下表所示，请给该同学制定最省钱的选购方案。（注：在同一个书店买多本书也只会收取一次运费）
在这里插入图片描述 （4）背包问题（如果有n件货物，那么可能性有2ⁿ种）

上述的这些问题，均是求某一目标函数的最值问题。（某一给定的函数、旅行的路程或费用、买书的花费、利润）
MATLAB中所求出的是最小值，在求最大值时候可以给目标函数添加符号等方法转化成求最小值问题。

青铜级别解法（盲目搜索）

1. 蒙特卡洛模拟
2. 对比穷举法

但在解空间的可能情况特别多时，这两种方法就凉凉。

王者级别解法（启发式搜索）

模拟退火算法(以一定概率接受新的解）
求函数 $y = 11 s i n x + 7 c o s (5 x)$ 在[-3,3]内的最大值
旧的解：x_i对应的函数值f(x_i)
新的解：在x_i“附近”随机寻找一个新的解x_j，对应的函数值为f(x_i)

如果f(x_j)>f(x_j)，则接受新解x_j；
如果f(x)≤f(x_i),我们不能直接拒绝x_j；

解决方法： 为了不直接拒绝x_j，我们定义一个接受的概率p，p位于[0,1]之间，且f(x_j)和f(x_i)越接近，p越大。（意思就是，新解和旧解的函数值越接近，我们就越愿意接受新解。）
即p正比于 $\frac{1}{|f(x_j)-f(x_i)|}$ ，记为p∝ $\frac{1}{|f(x_j)-f(x_i)|}$

接着思考：概率p位于[0,1]之间，哪个常见的函数值域是位于[0,1]之间的？
不唯一，但有一个函数形式很简单： $y=e^{-x}(x≥0)$ ，关于x单调递减：
在这里插入图片描述所以我们可以假设： $p∝e^{-|f(x_j)-f(x_i)|}$

接受新解的概率p越大，意味着在解空间中搜索的范围越大

原因：接受新解的概率p越大，意味着我们的搜索更容易接受不好的解，这时候就相当于增加了我们的搜索范围。

假设我们将搜索过程看作一个“工序”，那么搜索前期，我们的搜索范围应该尽量的大，搜索后期我们的搜索范围应该尽量的小。

原因：在搜索前期，我们要尽可能的扩大我们的搜索范围，这样能够避免陷入局部最优解；在搜索后期我们要倾向于局部搜索。（渣男套路：前期广撒网、后期精准打击）

我们对式子 $p∝e^{-|f(x_j)-f(x_i)|}$ 进行一个变形：
$p_t∝e^{-|f(x_j)-f(x_i)|×C_t}$

其中：C_t可以看作一个和时间有关的系数，因此在搜索过程中，我们接受新解的概率p就和时间有关，显然时间越长，C_t越大

原因：搜索前期t较小，我们希望搜索的范围大，即更倾向于接受新解，那么对应的p就应该大一些，而C_t与p负相关，因此C_t应该小一点；搜索后期我们希望p较小，那么C_t应该大一点，因此我们可以得出结论：C_t关于t递增。

操作方法

我们的搜索过程（假设求最大值问题）可以用下面这个简单的流程表示：

随机生成一个解，计算解A对应的目标函数值f(A)
在A附近随机产生一个解B，计算解B对应的目标函数值f(B)、
如果f(B)＞f(A),那么将解B的值给解A，然后重复上面步骤（爬山法的思想）；
如果f(B) ≤ f(A),那么我们接受B的概率为 $p_t=∝e^{-|f(x_j)-f(x_i)|×C_t}$ ，然后我们生成一个[0,1]之间的随机数r，如果r<p，我们就将解B赋值给解A，然后重复上面的步骤；否则我们返回第2步，在原来的A附近再重新生成一个解B，然后继续下去。

需要研究的地方

如果这个优化问题有约束条件怎么办？

编写一个筛选随机数的程序就好啦。

这个C_t怎么设置？

定义初始温度T₀=100，温度下降的公式为：T_t+1=αT_t，α常取0.95，那么时刻t时的温度：T_t=αT₀=100×0.95^t.
取 $C_t=\frac{1}{T_t}=\frac{1}{100×0.95^t}$ ，那么 $p_t=∝e^{-\frac{|f(x_j)-f(x_i)|}{100×0.95^t}}$
注意：这里的倒数是为了保证C_t关于t递增。
$p_t=∝e^{-\frac{|f(x_j)-f(x_i)|}{T_t}}$
记 $Δ f = ∣ f (B) - f (A) ∣$

那么p到底有多大呢？
在这里插入图片描述

温度一定时，Δf越小，概率越小，即目标函数相差越小接受的可能性越大。
Δf一定时，温度越高，概率越大，即搜索前期温度较高时更有可能接受新解。

t的变化在编程里面怎么实现？

可以看成我们迭代的次数。（采用循环）
t表示时间，迭代第一次，迭代第二次，t从1到1000，就迭代1000次。
为了保证搜索过程的彻底，在同一温度下（同一个小t），我们需要进行多次搜索（例如重复上面的流程500次）；之后我们降低温度，然后再来进行新的一轮搜索。
用编程的话是由两层循环。

什么时候停止搜索?

有很多种准则：

达到指定的迭代次数，例如迭代200次；
达到指定的温度，例如温度小于0.000001；
我们找到最优解连续M次（例如30次）迭代都没有变化。

怎么在A附近随机生成一个新解B？

题目1：求给定函数的最大值或者最小值

我们以n元函数求最值为例，来介绍新解的产生规则：
假设当前解为:(x₁，x₂，…，x_n)
我们首先生成一组随机数（y₁，y₂，…，y_n），其中y_i服从N(0,1)
[均值为0，方差为1的正态分布]
接下来我们再计算(z₁，z₂，…，z_n）其中 $z_1=y/\sqrt{y_1^2＋y_2^2＋…＋y_n^2}$
[对随机数进行标准化]
对于每一个i∈[1,n]，来产生一个新解，即进行下面操作：

计算：x_i^new=x_i+T×z_i，T是当前的温度（也可以使用x_i^new=x_i＋ $\sqrt{T}$ ×z_i）;
接下来检查x_i^new是否位于上下界内，即是否满足lb_i≤x_i^new≤ub这个约束：
a.如果lb_i≤x_i^new≤ub满足，则直接令x_j=x_i^new即可；
b.如果x_i^new＜lb_i，则 $x_j=r×lb_i＋(1-r)×x_i^{new}$ 这里r是区间[0,1]上均匀分布的随机数；
c.如果x_i^new＞ub_i，则 $x_j=r×ub_i＋(1-r)×x_i^{new}$ 这里r是区间[0,1]上均匀分布的随机数。