智能优化算法之模拟退火算法(SA)的实现(Python附源码)

一、模拟退火算法的实现思路

模拟退火算法(Simulated Annealing Algorithm,简称SA)是一种基于蒙特卡洛迭代求解策略的随机优化算法,其思想起源是于1953年由Metropolis等人提出的。由于模拟退火算法在理论上具有概率全局最优化的能力,因此它在工程控制、生产调度、信号处理、机器学习等诸多领域都得到了广泛的应用。
模拟退火算法中涉及到的概念主要有三个,这三个分别为目标函数、接受概率以及冷却进度表。

1、目标函数

模拟退火算法的整个降温过程可以类比于在目标范围内求取最优解的过程,将金属固体的内能类比于目标函数值,当温度这个控制参数在变化时,金属固体的内能在不断改变,此时通过一定概率判断是否接受这个新的内能,即最优解。

2、接受概率

接受概率即为判断是否接受新的内能的概率,模拟退火算法中通常使用Metropolis接受准则进行接受概率的计算,在此准则中,倘若内能朝着想要的趋势发生变化(若为求解最小值,则∆E<0,若为求解最大值,则∆E>0),则接受新的状态,否则将使用概率exp⁡(-∆E/kT)来判断是否接受新的状态,其中k为Boltzmann常数,通常取值为1.3806×10^(-23)。

3、冷却进度表

在每个状态的变化过程中,温度值起到至关重要的作用,尤其是Metropolis接受准则中是否接受新的状态的概率直接与温度值相关,而温度应当处于一个不断降低的状态,即温度越低时,出现内能改变的可能性也会降低,因此在这里采用冷却进度表来控制温度的变化。冷却进度表是指用来控制从某高温状态T开始进行降温的幅度和趋势的管理表,假设t时刻的温度为T,那么在经典的模拟退火算法中,温度随着时间的变化趋势可以表示为T/lg⁡(1+t),而在快速模拟退火算法中,温度随着时间的变化趋势可以表示为T/⁡(1+t),这二者的区别主要表现在变化的速度上,但它们都可以帮助算法有效收敛到全局最优值处。另外在实际的应用中,时刻t可以使用迭代次数来代替。
在上述模拟退火算法原理中主要涉及到的参数分别为:初始温度T;温度下限T_min,此值主要控制温度的最低值,当达到此值时将不再进行状态的改变。

二、算法步骤

使用模拟退火算法对优化问题进行求解时的具体步骤可以归纳如下:

  1. 设置初始温度T、温度下限T_min、初始的解状态、每个温度T值下的迭代次数L以及算法停止迭代条件(一般设为当连续多个新解都没有被接受时停止算法);
  2. 根据目标函数,对初始解对应的目标函数值(适应度值)进行计算;
  3. 对初始的解进行变换,产生一个目标范围内的新解,通常采用简单的变换产生新解,例如对旧解中的全部或部分元素进行置换、互换、与随机数相加等;
  4. 根据目标函数,对新解对应的目标函数值(适应度值)进行计算;
  5. 通过新解与旧解的目标函数值(适应度值)计算它们之间的差值,然后使用Metropolis接受准则判断是否接受新解,若接受,则舍弃旧解,使用新解替代旧解;
  6. 重复上述步骤2到步骤5,直至达到迭代次数L;
  7. 判断此时是否满足停止迭代条件,若满足则输出此时的解,若不满足,则使用冷却进度表对温度进行更新;
  8. 对温度进行更新后判断是否达到温度下限值,若达到则输出此时的解,若不满足,则重复步骤6到步骤7;
  9. 当满足停止迭代条件或温度达到温度下限值时,停止算法寻优,输出此时的解状态及其对应的目标函数值。

三、实例

待求解问题:
Rosenbrock’s,取值范围为[-10,10],取值范围内的理想最优解为0,将其搜索的空间维度设为20。
在这里插入图片描述

实现源码:

#库的导入
import numpy as np
import math
import matplotlib.pyplot as plt
#待求解问题
def function(x):
    y1 = 0
    for i in range(len(x) - 1):
        y2 = 100 * ((x[i + 1] - x[i] ** 2) 
  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

七层楼的疯子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值