在解优化问题的时候常常会提到模拟退火。
什么是模拟退火呢?
其实很简单,在普通的贪心求解过程中,常常陷入局部最优解,如求01背包问题的时候,直接用贪心,很可能得不到最优解。
在模拟退火算法中,会根据一定的概率跳出局部最优解,而这个一定的概率就是根据metropolis而来。metropolis是物理中退火过程,感兴趣的可以自行查找。用公式表示为:
可以看到,在公式中,当前值优于之前的目前最优值,概率为1,直接取当前值为最优值,和普通的贪心一样。在当前值逊于目前最优值时,以概率大小为p的可能性是否取当前值,而并不是直接舍去。注意,只有在E值最佳时才会取而代之,这里概率p下取得的值作为下一次的old值,若为迭代,则为是否为下一次迭代的输入。
公式中T是一个函数,它影响概率的变化率。在原始的模拟退火中,物理意义是温度。T函数可以取值为:
T0是初始值。
有时这个概率影响太小,使得收敛过慢,也可以用: