数学建模:现代优化算法之模拟退火

数学建模:现代优化算法之模拟退火

开始了开始了!!!


肝!


前言

现代优化算法是上世纪80年代初兴起的启发式算法。这些算法包括禁忌搜索(tabu search),模拟退火(simulated annealing),遗传算法(genetic algorithms),人工神经网络(neural networks)。它们主要用于解决大量的实际应用问题。
目前,这些算法在理论和实际应用方面得到了较大的发展。无论这些算法是怎样产生的,它们有一个共同的目标——求NP-hard组合优化问题的全局最优解。虽然有这些目标,但NP-hard理论限制它们只能以启发式的算法去求解实际问题。
启发式算法包含的算法很多,例如解决复杂优化问题的蚁群算法(Ant Colony Algorithms)。有些启发式算法是根据实际问题而产生的,如解空间分解解空间的限制等;另一类算法是集成算法,这些算法是诸多启发式算法的合成。


Simulated annealing algorithm(SAA算法)

1.算法简介

模拟退火算法得益于材料统计力学的研究成果。统计力学表明材料中粒子的不同结构对应于粒子的不同能量水平。在高温条件下,粒子的能量较高,可以自由运动和重新排列。在低温条件下,粒子能量较低。如果从高温开始,非常缓慢地降温(这个过程被称为退火),粒子就可以在每个温度下达到热平衡。当系统完全被冷却时,最终形成处于低能状态的晶体。

数学基础

如果用粒子的能量定义材料的状态,Metropolis算法用一个简单的数学模型描述了退火过程。假设材料在状态 i i i之下的能量为 E ( i ) E(i) E(i),那么材料在温度 T T T时从状态 i i i进入状态 j j j就遵循如下规律:
(1)如果 E ( j ) ≤ E ( i ) E(j)\le E(i) E(j)E(i),接受该状态被转换。
(2)如果 E ( j ) > E ( i ) E(j)>E(i) E(j)>E(i),则状态转换以如下概率被接受
e E ( i ) − E ( j ) K T , e^\frac{E(i)-E(j)}{KT}, eKTE(i)E(j)
其中 K K K是物理学中的波尔兹曼常数, T T T是材料温度。

在某一个特定温度下,进行了充分的转换之后,材料将达到热平衡。这时材料处于状态 i i i的概率满足波尔兹曼分布
P T ( X = i ) = e − E ( i ) K T ∑ j ∈ S e − E ( j ) K T , P_T(X=i)=\frac{e^{-\frac{E(i)}{KT}}}{\sum_{j\in S} e^{-\frac{E(j)}{KT}}}, PT(X=i)=jSeKTE(j)eKTE(i)
其中 X X X表示材料当前状态的随机变量, S S S表示状态空间集合。

显然
lim ⁡ T → ∞ e − E ( i ) K T ∑ j ∈ S e − E ( j ) K T = 1 ∣ S ∣ , \lim_{T\rightarrow\infty}{\frac{e^{-\frac{E(i)}{KT}}}{\sum_{j\in S} e^{-\frac{E(j)}{KT}}}}=\frac{1}{|S|}, TlimjSeKTE(j)eKTE(i)=S1
式中: ∣ S ∣ |S| S表示集合S中状态的数量。这表明所有状态在高温下具有相同的概率。

而当温度下降时,有
lim ⁡ T → 0 e − E ( i ) − E m i n K T ∑ j ∈ S ∑ e − E ( j ) − E m i n K T = lim ⁡ T → 0 e − E ( i ) − E m i n K T ∑ j ∈ S m i n ∑ + ∑ j ∉ S m i n ∑ e − E ( j ) − E m i n K T e − E ( j ) − E m i n K T \lim_{T\rightarrow0}\frac{e^{-\frac{E\left(i\right)-E_{{min}}}{KT}}}{\sum_{j\in S}^{\sum}e^{-\frac{E\left(j\right)-E_{{min}}}{KT}}=\lim_{T\rightarrow0}\frac{e^{-\frac{E\left(i\right)-E_{{min}}}{KT}}}{\sum_{j\in S_{{min}}}^{\sum+\sum_{j\notin S_{{min}}}^{\sum}e^{-\frac{E\left(j\right)-E_{{min}}}{KT}}}e^{-\frac{E\left(j\right)-E_{{min}}}{KT}}}} T0limjSeKTE(j)Emin=limT0jSmin+j/SmineKTE(j)EmineKTE(j)EmineKTE(i)EmineKTE(i)Emin
式中: E min ⁡ j ∈ S m i n E ( j ) {E\min_{j\in S}}_{min}{E(j)} EminjSminE(j) S m i n m i n {S{min}}_{{min}} Sminmin

算法思路整理

在这里插入图片描述
算法流程

  1. 设定当前解(即为当前的最优解)
  2. 产生新解与当前解差值
  3. 判断新解是否被接受
  4. 当新解被确定接受时,新解被作为当前解
  5. 循环以上四个步骤
  6. 最后找到全局最优解
    在这里插入图片描述

参数讲解
退火过程由一组初始参数,即冷却进度表控制。它的目的是尽量使系统达到平衡,以使算法在有限的时间内逼近最优解。

冷却进度表包括:

  1. 控制温度参数的初值 T 0 T_0 T0
  2. 控制温度 T T T的衰减参数(温度的更新)
  3. 马尔科夫链的长度 L k L_k Lk(迭代次数)
  4. 控制参数 T T T的终值(停止准则)

相似性比较

组合优化问题金属物体
粒子状态
最优解能量最低的状态
设定初温熔解过程
Methopolis等温过程
控制参数的下降冷却
目标函数能量

优点
· 高效地求解NP完全问题(如TSP问题,0-1背包问题等)
· 相较于其他非线性与优化算法,模拟退火算法编程工作量小且易于实现

缺点
· 使用不当,可能会陷入局部最优
· 参数难以控制,所得结果可能为接近最优解但并非最优解

算法对比
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

注意事项

(1)理论上,降温过程要足够缓慢,要使得在每一温度下达到热平衡。但在计算机实现中,如果降温速度过缓,所得到的解的性能会较为令人满意,但是算法会太慢,相对于简单的搜索算法不具有明显优势。如果降温速度过快,很可能最终得不到全局最优解。因此使用时要综合考虑解的性能和算法速度,在两者之间采取一种折衷。
(2)要确定在每一温度下状态转换的结束准则。实际操作可以考虑当连续 m m m次的转换过程没有使状态发生变化时结束该温度下的状态转换。最终温度的确定可以提前定为一个较小的值 T e T_e Te,或连续几个温度下转换过程没有使状态发生变化算法就结束。
(3)选择初始温度和确定某个可行解的邻域的方法也要恰当。

补充:Metropolis算法

Metropolis 算法是马尔可夫链蒙特卡洛【Markov Chain Monte Carlo, MCMC】的一种特殊算法。

Metropolis采样算法为CSDN博主「jingjishisi」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/jingjishisi/article/details/79291258

2.应用举例

【例一】 已知100个目标的经度、纬度如表12.1所示。
在这里插入图片描述
我方有一个基地,经度和纬度为 ( 70 , 40 ) (70,40) 70,40。假设我方飞机的速度为 1000 1000 1000公里/小时。我方派一架飞机从基地出发,侦察完所有目标,再返回原来的基地。在每一目标点的侦察时间不计,求该架飞机所花费的时间(假设我方飞机巡航时间可以充分长)。

这是一个旅行商问题。给我方基地编号为 1 1 1,目标依次编号为 2 , 3 , … , 101 2,3,…,101 23101,最后我方基地再重复编号为 102 102 102(这样便于程序中计算)。距离矩阵 D = ( d i j ) 102 × 102 D=(d_{ij})_{102\times102} D=(dij)102×102,其中 d i j d_{ij} dij表示表示 i , j i,j i,j两点的距离, i , j = 1 , 2 , ⋯   , 102 i,j=1,2,\cdots,102 i,j=1,2,,102,这里 D D D为实对称矩阵。则问题是求一个从点 1 1 1出发,走遍所有中间点,到达点 102 102 102的一个最短路径。

上面问题中给定的是地理坐标(经度和纬度),必须求两点间的实际距离。设 A , B A,B A,B两点的地理坐标分别为 ( x 1 , y 1 ) , ( x 2 , y 2 ) (x_1,y_1),(x_2,y_2) (x1,y1)(x2,y2),过 A , B A,B A,B两点的大圆的劣弧长即为两点的实际距离。以地心为坐标原点 O O O,以赤道平面为 X O Y XOY XOY平面,以0度经线圈所在的平面为 X O Z XOZ XOZ平面建立三维直角坐标系。则 A , B A,B A,B两点的直角坐标分别为
A ( R cos ⁡ x 1 cos ⁡ y 1 , R sin ⁡ x 1 cos ⁡ y 1 , R sin ⁡ y 1 ) , A(R\cos{x_1}\cos{y_1},R\sin{x_1}\cos{y_1},R\sin{y_1}), A(Rcosx1cosy1,Rsinx1cosy1,Rsiny1)
B ( R cos ⁡ x 2 cos ⁡ y 2 , R sin ⁡ x 2 cos ⁡ y 2 , R sin ⁡ y 2 ) , B(R\cos{x_2}\cos{y_2},R\sin{x_2}\cos{y_2},R\sin{y_2}), B(Rcosx2cosy2,Rsinx2cosy2,Rsiny2)
式中: R = 6370 k m R=6370km R=6370km为地球半径。

A , B A,B A,B两点的实际距离
d = R a r c c o s ( O A ⃗ ⋅ O B ⃗ ∣ O A ⃗ ∣ ⋅ ∣ O B ⃗ ∣ ) , d=R{arccos}{\left(\frac{\vec{\mathrm{OA}}\cdot\vec{OB}}{\left|\vec{\mathrm{OA}}\right|\cdot\left|\vec{OB}\right|}\right)}, d=RarccosOA OB OA OB

化简得
d = R arccos ⁡ [ c o s ( x 1 − x 2 ) c o s y 1 c o s y 2 + s i n y 1 s i n y 2 ] . d=R\arccos{[}{cos}{(}x_1-x_2){cos}{y_1}{cos}{y_2}+{sin}{y_1}{sin}{y_2}]. d=Rarccos[cos(x1x2)cosy1cosy2+siny1siny2].

推导过程如下:
在这里插入图片描述

求解的模拟退火算法描述如下:

(1)解空间

解空间 S S S可表为 1 , 2 , ⋯   , 101 , 102 {1,2,\cdots,101,102} 1,2,,101,102的所有固定起点和终点的循环排列集合,即
S = { ( π 1 , ⋯   , π 102 ) ∣ π 1 = 1 , ( π 2 , ⋯   , π 101 ) 为 2 , 3 , ⋯ , 101 的 循 环 排 列 , π 102 = 102 } , S=\lbrace{(\pi_1,\cdots,\pi_{102})|\pi_1=1,(\pi_2,\cdots,\pi_{101})为{2,3,⋯,101}的循环排列,\pi_{102}=102}\rbrace , S={(π1,,π102)π1=1,(π2,,π101)2,3,,101,π102=102}
其中每一个循环排列表示侦察 100 100 100个目标的一个回路, π i = j \pi_i=j πi=j表示在第 i − 1 i-1 i1次侦察目标 j j j,初始解可选为 ( 1 , 2 , ⋯   , 102 ) (1,2,\cdots,102) (1,2,,102),本文中我们先使用Monte Carlo(蒙特卡洛)方法求得一个较好的初始解。

回顾蒙特卡洛方法:
线性规划问题中有所提及:
蒙特卡洛方法又称统计模拟法、随机抽样技术,是一种随机模拟方法,以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解

(2)目标函数

目标函数(或称代价函数)为侦察所有目标的路径长度。要求
min ⁡ f ( π 1 , π 2 , ⋯   , π 102 ) = ∑ i = 1 101 d π i π i + 1 , \min{f}(\pi_1,\pi_2,\cdots,\pi_{102})=\sum_{i=1}^{101}d_{\pi_i\pi_{i+1}}, minf(π1,π2,,π102)=i=1101dπiπi+1
而一次迭代由下列三步构成

(3)新解的产生

设上一步迭代的解为
π 1 ⋯ π u − 1 π u π u + 1 ⋯ π v − 1 π v π v + 1 ⋯ π w − 1 π w π w + 1 ⋯ π 102 。 \pi_1\cdots\pi_{u-1}\pi_u\pi_{u+1}\cdots\pi_{v-1}\pi_v\pi_{v+1}\cdots\pi_{w-1}\pi_w\pi_{w+1}\cdots\pi_{102}。 π1πu1πuπu+1πv1πvπv+1πw1πwπw+1π102

i) 2变换法

任选序号 u , v u,v u,v,交换 u u u v v v之间的顺序,变成逆序,此时的新路径为
π 1 ⋯ π u − 1 π v π v − 1 ⋯ π u + 1 π u π v + 1 ⋯ π 102 . \pi_1\cdots\pi_{u-1}\pi_v\pi_{v-1}\cdots\pi_{u+1}\pi_u\pi_{v+1}\cdots\pi_{102}. π1πu1πvπv1πu+1πuπv+1π102.

ii) 3变换法

任选序号 u , v u,v u,v w w w,将 u u u v v v之间的路径插到 w w w之后,对应的新路径为
π 1 ⋯ π u − 1 π v + 1 ⋯ π w π u ⋯ π v π w + 1 ⋯ π 102 \pi_1\cdots\pi_{u-1}\pi_{v+1}\cdots\pi_w\pi_u\cdots\pi_v\pi_{w+1}\cdots\pi_{102} π1πu1πv+1πwπuπvπw+1π102

(4)代价函数差

对于2变换法,路径差可表示为
Δ f = ( d π u − 1 π v + d π u π v + 1 ) − ( d π u − 1 π u + d π v π v + 1 ) \Delta f=(d_{\pi_{u-1}\pi_v}+d_{\pi_u\pi_{v+1}})-(d_{\pi_{u-1}\pi_u}+d_{\pi_v\pi_{v+1}}) Δf=(dπu1πv+dπuπv+1)(dπu1πu+dπvπv+1)

(5)接受准则

P = { 1 , Δ f < 0 , e x p ( − Δ f / T ) , Δ f ≥ 0. P=\begin{cases} 1,&Δf<0,\\ exp(-Δf/T),&Δf≥0.\\ \end{cases} P={1,exp(Δf/T),Δf<0,Δf0.

如果 Δ f < 0 \Delta f<0 Δf<0,则接受新的路径。否则,以概率 e x p ( − Δ f / T ) {exp}{(}-\Delta f/T) exp(Δf/T) 接受新的路径,即用计算机产生一个[0,1]区间上均匀分布的随机数rand,若 r a n d ≤ e x p ( − Δ f / T ) rand\le{exp}{(}-\Delta f/T) randexp(Δf/T)则接受。

(6)降温

利用选定的降温系数 α \alpha α进行降温,取新的温度 T T T α T \alpha T αT(这里 T T T为上一步迭代的温度),这里选定 α = 0.999 \alpha=0.999 α=0.999

(7)结束条件

用选定的终止温度 e = 1 0 − 30 e=10^{-30} e=1030,判断退火过程是否结束。若 T < e T<e T<e,算法结束,输出当前状态。

编写MATLAB程序如下:

clc, clear, close all

%% 数据预处理
sj0=load('C:\Users\Administrator\Desktop\“高教杯”国赛备赛\数学建模算法与应用(第3版)源程序\程序及数据\12第12章  现代优化算法\data12_1.txt');
x=sj0(:,[1:2:8]); x=x(:); %取奇数列(经度列) 
y=sj0(:,[2:2:8]); y=y(:); %取偶数列(维度列)
sj=[x y] %【经度,维度】
d1=[70,40]; %基地位置,经度和纬度为(70,40)
xy=[d1;sj;d1]; %将基地位置加在首尾


%% 目标函数
sj=xy*pi/180; %角度化成弧度
d=zeros(102); %距离矩阵d初始化
%计算弧长
for i=1:101
   for j=i+1:102
       d(i,j)=6370*acos(cos(sj(i,1)-sj(j,1))*cos(sj(i,2))*...
           cos(sj(j,2))+sin(sj(i,2))*sin(sj(j,2)));
   end
end
d=d+d';


%% 初始解
path=[];long=inf; %巡航路径及长度初始化   设置long为无穷大
for j=1:1000  %求较好的初始解
    path0=[1 1+randperm(100),102]; temp=0; % p = randperm(n)生成一个从 1 到 n 的整数的随机排列
    for i=1:101
        temp=temp+d(path0(i),path0(i+1));
    end
    if temp<long
        path=path0; long=temp;
    end
end

%% 导入参数
e=0.1^30; % 控制温度参数的终值
L=20000; % 马尔科夫链的长度
at=0.999; % 控制温度的损减参数
T=1; % 控制温度参数的初值

%% 退火过程
for k=1:L
    
     % 新解的产生
    c=2+floor(100*rand(1,2));  % floor():朝负无穷大四舍五入,相当于"下取整"
    c=sort(c); c1=c(1);c2=c(2); % c1最小,c2次小
    
    %计算代价函数值的增量
    df=d(path(c1-1),path(c2))+d(path(c1),path(c2+1))-...
        d(path(c1-1),path(c1))-d(path(c2),path(c2+1));
    
    %接受准则
    if df<0 %接受,则状态转换
        path=[path(1:c1-1),path(c2:-1:c1),path(c2+1:102)]; long=long+df;
    elseif exp(-df/T)>=rand %否则则以一定的概率接受
        path=[path(1:c1-1),path(c2:-1:c1),path(c2+1:102)]; long=long+df;
    end
    %降温
    T=T*at;
    if T<e
        break;
    end
end

%% 输出结果
path, long % 输出巡航路径及路径长度
xx=xy(path,1); yy=xy(path,2);

%% 可视化

plot(xx,yy,'-*') %画出巡航路径


计算结果为44小时左右。其中的一个巡航路径如图12.1所示。
在这里插入图片描述

参考

1,《数学建模算法及其应用》第五版
2, 感谢哔哩哔哩up主:连大数学建模
参考网址2021美赛赛前培训

总结

keep going on!

  • 4
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值