模拟退火算法

白炎灵

于 2022-05-20 15:44:21 发布

阅读量646

点赞数

分类专栏：数据分析文章标签：模拟退火算法算法机器学习

本文链接：https://blog.csdn.net/weixin_43135165/article/details/124884078

版权

数据分析专栏收录该内容

25 篇文章 1 订阅

订阅专栏

介绍

模拟退火算法最早的思想是由N.Metroplis等人于1953年提出的，1983年，S.Kirkpatrick等人成功地将退火思想引入到组合优化领域，提出一种解决大规模组合优化问题，特别是NP完全组合优化难题的有效近似算法——模拟退火算法。它是来源于固体退火的原理，先将固体加温至充分高，再将其徐徐冷却的过程。加温时，固体内部例子随温度上升而变为无序态，内能增大，而徐徐冷却时粒子渐渐趋有序态，在每个温度点上都能达到平衡态，最后在常温时达到基态，内能减为最小。模拟退火算法应用于组合最优化，克服了优化过程中局部极小和初值依赖性的缺陷。

根据 $M e t r o p l i s$ 准则，内部粒子在温度T时趋于平衡的概率为 $e (- ∆ E / k T)$ ，其中 $E$ 为当温度 $T$ 时的内能， $∆ E$ 为内能改变量， $k$ 为 $B o l t z m a n n$ 常数。用固体退火过程来模拟组合优化问题，先将内能E模拟为目标函数值 $f$ ，温度 $T$ 演化成控制参数 $t$ ，即可得到解投资组合优化问题的模拟退火算法：由初始解 $s$ 和控制参数初值 $t$ 开始，对当前解重复“产生新解-计算目标函数差-判断是否接受-接受或舍弃”的迭代过程，并逐步衰减当前温度t值，直至达到阶数温度，算法终止时的当前解即为所得近似最优解，这是一种基于蒙特卡罗迭代求解法的启发式随机搜索过程。退火过程由冷却进度表控制，包括控制参数的温度初值t及其衰减因子 $∆ t$ 、每个 $t$ 值时的迭代次数 $L$ 和停止条件 $S$ 。

固定退火过程的物理图像和统计性质是模拟退火算法的物理背景；冷却进度表的合理选择是算法应用的前提；而 $M e t r o p o l i s$ 接受准则使算法脱离局部最优的“陷阱”。

步骤

在这里插入图片描述
模拟退火的基本思想如下：

1）初始化：初始温度 $T$ （充分大），初始解状态 $S$ （是算法迭代的起点），每个T值的迭代次数 $L$ （马尔科夫链），减温系数 $K$ 。
2）对 $i = 1, \dots \dots, L$ 做3)至6)循环，完成一次马尔科夫链。
3）通过变异产生新解 $S^{'}$ 。
4）计算增量 $∆ t^{'} = C (S^{'}) - C (S)$ ，其中 $C (S)$ 为评价函数。
5）若 $∆ t^{'} < 0$ 则接受 $S^{'}$ 作为新的当前解，否则以概率 $e x p (- ∆ t^{'} / T)$ 接受 $S^{'}$ 作为新的当前解。
6）如果满足终止条件则输出当前解作为最优解，结束程序。否则转到7）。
7） $T$ 逐渐减少 $(T = T * K)$ ，且 $T > 0$ ，然后转2）。

目标函数的选择

方法1：乘法函数法：
应用乘法函数法可以将 $M - V$ 模型转化为如下的惩罚函数 $L (X)$ 的无约束优化问题来进行求解：
$minL(x)=f(X)+M(max⁡(0,(δ-R^T X)))$
其中， $M$ 为惩罚因子，是充分大的正数。

方法2：正态假设法
以 $δ$ 为目标收益率，那么投资组合最优化的目标即为使组合收益率达到δ的概率最大化 $max_x⁡ P(r_p≥δ)$ 。

假设每个证券的期望收益率均服从正态分布，那么投资组合的收益率也服从正态分布，即
$r_p=\sum_{i=1}^nx_i r_i \sim N(R^T X,X^T\sum X)$

从而概率最大化的模型可以表示为
$min_x⁡f(x)=min_x⁡[\frac{(δ-R^T X)}{(X^T\sum X)^{\frac{1}{2}} }]$

参数选择

1）目标收益率 $δ$ 。 $δ$ 应大于所选取的30支股票的最高收益率。

2）相邻状态的产生
由于模拟退火算法的 $M a r k o v$ 性，相邻状态的产生依赖于当前状态。假设当前状态下投资组合权重为 $X^k=(x_1,x_2,…,x_n)$ ，
它的相邻状态产生函数为 $x_i^{k+1}=x_i+\alpha (b-a)=x_i^k+\alpha$ 。其中， $\alpha$ 为 $(0, 1)$ 上的随机数， $[a, b]$ 为 $x$ 的取值范围，即 $[0, 1]$ 。

3）温度衰减函数。 $T_k=\frac{T_0}{k^m} ,k=1,2,…$ 其中， $T_0$ 是初始温度， $m$ 是一个大于等于1的常数，通常取3； $T_k$ 是第 $k$ 次降温后的温度。

4）终止条件。温度最终降为 $T = 0.0001$ （接近零度，冷却状态）时循环过程结束。

在参数选择的过程中，对初始温度及内层迭代的次数没有进行设置，由于这两个参数直接决定着算法的循环次数以及优化效果，初始温度的选择越高，则退温次数越多，搜索到全局最优的可能性越大，从而得到的结果比较稳定。但算法的迭代次数增加会降低算法的可行性和有效性，因此本文通过几次尝试，选择最适合的参数来控制循环次数和结果。

参考文献：
《数据分析——R语言实战》李诗羽、张飞、王正林