模拟退火算法

介绍

模拟退火算法最早的思想是由N.Metroplis等人于1953年提出的,1983年,S.Kirkpatrick等人成功地将退火思想引入到组合优化领域,提出一种解决大规模组合优化问题,特别是NP完全组合优化难题的有效近似算法——模拟退火算法。它是来源于固体退火的原理,先将固体加温至充分高,再将其徐徐冷却的过程。加温时,固体内部例子随温度上升而变为无序态,内能增大,而徐徐冷却时粒子渐渐趋有序态,在每个温度点上都能达到平衡态,最后在常温时达到基态,内能减为最小。模拟退火算法应用于组合最优化,克服了优化过程中局部极小和初值依赖性的缺陷。

根据 M e t r o p l i s Metroplis Metroplis准则,内部粒子在温度T时趋于平衡的概率为 e ( − ∆ E / k T ) e(-∆E/kT) e(E/kT),其中 E E E为当温度 T T T时的内能, ∆ E ∆E E为内能改变量, k k k B o l t z m a n n Boltzmann Boltzmann常数。用固体退火过程来模拟组合优化问题,先将内能E模拟为目标函数值 f f f,温度 T T T演化成控制参数 t t t,即可得到解投资组合优化问题的模拟退火算法:由初始解 s s s和控制参数初值 t t t开始,对当前解重复“产生新解-计算目标函数差-判断是否接受-接受或舍弃”的迭代过程,并逐步衰减当前温度t值,直至达到阶数温度,算法终止时的当前解即为所得近似最优解,这是一种基于蒙特卡罗迭代求解法的启发式随机搜索过程。退火过程由冷却进度表控制,包括控制参数的温度初值t及其衰减因子 ∆ t ∆t t、每个 t t t值时的迭代次数 L L L和停止条件 S S S

固定退火过程的物理图像和统计性质是模拟退火算法的物理背景;冷却进度表的合理选择是算法应用的前提;而 M e t r o p o l i s Metropolis Metropolis接受准则使算法脱离局部最优的“陷阱”。

步骤

在这里插入图片描述
模拟退火的基本思想如下:

1)初始化:初始温度 T T T(充分大),初始解状态 S S S(是算法迭代的起点),每个T值的迭代次数 L L L(马尔科夫链),减温系数 K K K
2)对 i = 1 , … … , L i=1,……,L i=1,,L做3)至6)循环,完成一次马尔科夫链。
3)通过变异产生新解 S ′ S' S
4)计算增量 ∆ t ′ = C ( S ′ ) − C ( S ) ∆t'=C(S')-C(S) t=C(S)C(S),其中 C ( S ) C(S) C(S)为评价函数。
5)若 ∆ t ′ < 0 ∆t'<0 t<0则接受 S ′ S' S作为新的当前解,否则以概率 e x p ⁡ ( − ∆ t ′ / T ) exp⁡(-∆t'/T) exp(t/T)接受 S ′ S' S作为新的当前解。
6)如果满足终止条件则输出当前解作为最优解,结束程序。否则转到7)。
7) T T T逐渐减少 ( T = T ∗ K ) (T=T*K) (T=TK),且 T > 0 T>0 T>0,然后转2)。

目标函数的选择

方法1:乘法函数法:
应用乘法函数法可以将 M − V M-V MV模型转化为如下的惩罚函数 L ( X ) L(X) L(X)的无约束优化问题来进行求解:
m i n L ( x ) = f ( X ) + M ( m a x ⁡ ( 0 , ( δ − R T X ) ) ) minL(x)=f(X)+M(max⁡(0,(δ-R^T X))) minL(x)=f(X)+M(max(0,(δRTX)))
其中, M M M为惩罚因子,是充分大的正数。

方法2:正态假设法
δ δ δ为目标收益率,那么投资组合最优化的目标即为使组合收益率达到δ的概率最大化 m a x x ⁡ P ( r p ≥ δ ) max_x⁡ P(r_p≥δ) maxxP(rpδ)

假设每个证券的期望收益率均服从正态分布,那么投资组合的收益率也服从正态分布,即
r p = ∑ i = 1 n x i r i ∼ N ( R T X , X T ∑ X ) r_p=\sum_{i=1}^nx_i r_i \sim N(R^T X,X^T\sum X) rp=i=1nxiriN(RTX,XTX)

从而概率最大化的模型可以表示为
m i n x ⁡ f ( x ) = m i n x ⁡ [ ( δ − R T X ) ( X T ∑ X ) 1 2 ] min_x⁡f(x)=min_x⁡[\frac{(δ-R^T X)}{(X^T\sum X)^{\frac{1}{2}} }] minxf(x)=minx[(XTX)21(δRTX)]

参数选择

1) 目标收益率 δ δ δ δ δ δ应大于所选取的30支股票的最高收益率。

2)相邻状态的产生
由于模拟退火算法的 M a r k o v Markov Markov性,相邻状态的产生依赖于当前状态。假设当前状态下投资组合权重为 X k = ( x 1 , x 2 , … , x n ) X^k=(x_1,x_2,…,x_n) Xk=(x1,x2,,xn)
它的相邻状态产生函数为 x i k + 1 = x i + α ( b − a ) = x i k + α x_i^{k+1}=x_i+\alpha (b-a)=x_i^k+\alpha xik+1=xi+α(ba)=xik+α。其中, α \alpha α ( 0 , 1 ) (0,1) (0,1)上的随机数, [ a , b ] [a,b] [a,b] x x x的取值范围,即 [ 0 , 1 ] [0,1] [0,1]

3)温度衰减函数。 T k = T 0 k m , k = 1 , 2 , … T_k=\frac{T_0}{k^m} ,k=1,2,… Tk=kmT0,k=1,2,其中, T 0 T_0 T0是初始温度, m m m是一个大于等于1的常数,通常取3; T k T_k Tk是第 k k k次降温后的温度。

4)终止条件。温度最终降为 T = 0.0001 T=0.0001 T=0.0001(接近零度,冷却状态)时循环过程结束。

在参数选择的过程中,对初始温度及内层迭代的次数没有进行设置,由于这两个参数直接决定着算法的循环次数以及优化效果,初始温度的选择越高,则退温次数越多,搜索到全局最优的可能性越大,从而得到的结果比较稳定。但算法的迭代次数增加会降低算法的可行性和有效性,因此本文通过几次尝试,选择最适合的参数来控制循环次数和结果。

参考文献:
《数据分析——R语言实战》李诗羽、张飞、王正林

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值