最优化算法之模拟退火算法(SA)

一、爬山算法 ( Hill Climbing )

  介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解
  爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。
这里写图片描述

二、模拟退火算法(SA)

1、退火的概念

  在热力学上,退火(annealing)现象指物体逐渐降温的物理现象,温度愈低,物体的能量状态会低;够低后,液体开始冷凝与结晶,在结晶状态时,系统的能量状态最低。大自然在缓慢降温(亦即,退火)时,可“找到”最低能量状态:结晶。但是,如果过程过急过快,快速降温(亦称「淬炼」,quenching)时,会导致不是最低能态的非晶形。
  如下图所示,首先(左图)物体处于非晶体状态。我们将固体加温至充分高(中图),再让其徐徐冷却,也就退火(右图)。加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小(此时物体以晶体形态呈现)。
这里写图片描述
似乎,大自然知道慢工出细活:缓缓降温,使得物体分子在每一温度时,能够有足够时间找到安顿位置,则逐渐地,到最后可得到最低能态,系统最安稳。

2、模拟退火(Simulate Anneal)的概念

  想象一下如果我们现在有下面这样一个函数,现在想求函数的(全局)最优解。如果采用Greedy策略,那么从A点开始试探,如果函数值继续减少,那么试探过程就会继续。而当到达点B时,显然我们的探求过程就结束了(因为无论朝哪个方向努力,结果只会越来越大)。最终我们只能找打一个局部最后解B。
这里写图片描述
  模拟退火其实也是一种Greedy算法,但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。以上图为例,模拟退火算法在搜索到局部最优解B后,会以一定的概率接受向右继续移动。也许经过几次这样的不是局部最优的移动后会到达B 和C之间的峰点,于是就跳出了局部最小值B。
【总结】:

  • 若f( Y(i+1) ) <= f( Y(i) ) (即移动后得到更优解),则总是接受该移动;
  • 若f( Y(i+1) ) > f( Y(i) ) (即移动后的解比当前解要差),则以一定的概率接受移动,而且这个概率随着时间推移逐渐降低(逐渐降低才能趋向稳定)相当于上图中,从B移向BC之间的小波峰时,每次右移(即接受一个更糟糕值)的概率在逐渐降低。如果这个坡特别长,那么很有可能最终我们并不会翻过这个坡。如果它不太长,这很有可能会翻过它,这取决于衰减 t 值的设定。

3、模拟退火算法伪代码

/*
* J(y):在状态y时的评价函数值
* Y(i):表示当前状态
* Y(i+1):表示新的状态
* r: 用于控制降温的快慢
* T: 系统的温度,系统初始应该要处于一个高温的状态
* T_min :温度的下限,若温度T达到T_min,则停止搜索
*/
while( T > T_min )
{
  dE = J( Y(i+1) ) - J( Y(i) ) ; 

  if ( dE >=0 ) //表达移动后得到更优解,则总是接受移动
        Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动
  else
  {
        // 函数exp( dE/T )的取值范围是(0,1) ,dE/T越大,则exp( dE/T )也
        if ( exp( dE/T ) > random( 0 , 1 ) )
        Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动
  }
  T = r * T ; //降温退火 ,0<r<1 。r越大,降温越慢;r越小,降温越快
  /*
  * 若r过大,则搜索到全局最优解的可能会较高,但搜索的过程也就较长。若r过小,则搜索的过程会很快,但最终可能会达到一个局部最优值
  */
  i ++ ;
}

4、模拟退火算法的步骤

1. 初始化温度T,初始解状态S,每个温度t下的迭代次数L;

2. 当k = 1,2,……,L时,进行3~6;

3. 对当前解进行变换得到新解S’(例如对某些解中的元素进行互换,置换);

4. 计算增量Δt′=C(S′)-C(S),其中C(S)为评价函数;

5. 若Δt′<0则接受S′作为新的当前解,否则以概率exp(-Δt′/(KT))接受S′作为新的当前解(k为玻尔兹曼常数,数值为:K=1.3806505(24) × 10^-23 J/K);

6. 如果满足终止条件则输出当前解作为最优解,结束程序;

7. 减小T,转到第2步,直到T小于初始设定的阈值。

这里写图片描述

5、模拟退火算法的优缺点

  • 迭代搜索效率高,并且可以并行化;
  • 算法中有一定概率接受比当前解较差的解,因此一定程度上可以跳出局部最优;
  • 算法求得的解与初始解状态S无关,因此有一定的鲁棒性;
  • 具有渐近收敛性,已在理论上被证明是一种以概率l 收敛于全局最优解的全局优化算法。

6、模拟退火算法的demo

#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <string>
#include <algorithm>
#include <random>
#include <cmath>
using namespace std;

#define ITERS 100 //迭代次数
#define T 100
#define T_min 1e-8
#define delta 0.98
#define INF 1e9

double x[ITERS];

double F(double x)
{
    return 1/4 * pow(x, 4) - 5/3 * pow(x, 3) + 3 * pow(x, 2) + 1;
}

void init()
{
    static std::mt19937 rng;
    static std::uniform_real_distribution<double> distribution(-2, 4);
    for (int i = 0; i < ITERS; i++)
    {
        x[i] = distribution(rng);
    }
}

double sa()
{
    double ans = INF;
    double t = T;
    while (t > T_min)
    {
        for (int i = 0; i < ITERS; i++)
        {   
            static std::mt19937 rng;
            static std::uniform_real_distribution<double> distribution(0, 1);
            double f_old = F(x[i]);
            double temp_x = x[i] + (distribution(rng) * 2 - 1) * t;
            if (temp_x >= -2 && temp_x <= 4)
            {
                double f_new = F(temp_x);
                if (f_old > f_new)
                    x[i] = temp_x;
                else
                {
                    double p = exp((f_new - f_old) / t);
                    if (p > distribution(rng))
                        x[i] = temp_x;
                }
            }
        }
        t = t * delta;
    }
    for (int i = 0; i < ITERS; i++)
    {
        ans = min(ans, F(x[i]));
    }
    return ans;
}
int main()
{
    init();
    cout << sa() << endl;
    system("pause");
    return 0;
}

参考:https://blog.csdn.net/qq_30981697/article/details/70032094?locationNum=9&fps=1
https://blog.csdn.net/baimafujinji/article/details/52573630
http://blog.jobbole.com/108559/
https://blog.csdn.net/baimafujinji/article/details/6474567
https://blog.csdn.net/google19890102/article/details/45395257

  • 52
    点赞
  • 417
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 9
    评论
模拟退火算法(Simulated Annealing,SA)是一种基于概率的全局优化算法,通常用于在大规模搜索空间中寻找全局最优解。它的基本思想是在解空间中随机漫步,接受劣解的概率随着温度的下降而减小,最终达到全局最优解。 下面是模拟退火算法的一个简单实现: 1. 初始化温度T和初始解x。 2. 重复以下操作,直到达到停止条件: - 生成一个新解x',使得x'在x的邻域中。 - 计算x'的目标函数值f(x')。 - 计算能量差ΔE=f(x')-f(x)。 - 如果ΔE<0,则接受x'作为新解。 - 如果ΔE>=0,则以概率e^(-ΔE/T)接受x'作为新解。 - 降低温度T。 3. 返回最优解。 其中,温度T的降低有多种方式,可以按照一定的函数关系进行指数下降,也可以按照一定的比例进行线性下降。 下面是一个简单的Python实现: ```python import random import math def simulated_annealing(init_solution, neighbor_func, objective_func, T, T_min, alpha): current_solution = init_solution best_solution = current_solution while T > T_min: for i in range(100): new_solution = neighbor_func(current_solution) delta_E = objective_func(new_solution) - objective_func(current_solution) if delta_E < 0: current_solution = new_solution if objective_func(current_solution) < objective_func(best_solution): best_solution = current_solution else: p = math.exp(-delta_E / T) if random.random() < p: current_solution = new_solution T *= alpha return best_solution ``` 其中,`init_solution`是初始解,`neighbor_func`是邻域函数,用于生成新解,`objective_func`是目标函数,用于计算解的价值,`T`是初始温度,`T_min`是最低温度,`alpha`是温度下降率。这里的邻域函数可以根据具体问题进行定义。 使用方法如下: ```python def neighbor_func(x): return [x[0] + random.uniform(-1, 1), x[1] + random.uniform(-1, 1)] def objective_func(x): return (x[0] - 1) ** 2 + (x[1] - 2) ** 2 init_solution = [0, 0] T = 1.0 T_min = 0.00001 alpha = 0.99 best_solution = simulated_annealing(init_solution, neighbor_func, objective_func, T, T_min, alpha) print('Best solution:', best_solution) print('Objective value:', objective_func(best_solution)) ``` 这里使用了一个简单的例子,目标函数为$(x_1-1)^2+(x_2-2)^2$,邻域函数为在当前解的基础上加上一个随机扰动。运行结果如下: ``` Best solution: [0.9864299254861487, 1.9646801078338144] Objective value: 0.0002519619956903344 ``` 可以看出,算法找到了较优的解。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

~青萍之末~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值