【三维装箱】基于遗传和模拟退火的三维装箱问题matlab源码

  模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e-ΔE/(kT),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。

模拟退火算法的模型   

模拟退火算法可以分解为解空间、目标函数和初始解三部分。  

模拟退火的基本思想:   

(1) 初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点), 每个T值的迭代次数L   

(2) 对k=1,……,L做第(3)至第6步:   

(3) 产生新解S′   

(4) 计算增量Δt′=C(S′)-C(S),其中C(S)为评价函数   

(5) 若Δt′<0则接受S′作为新的当前解,否则以概率exp(-Δt′/T)接受S′作为新的当前解.   

(6) 如果满足终止条件则输出当前解作为最优解,结束程序。 终止条件通常取为连续若干个新解都没有被接受时终止算法。   

(7) T逐渐减少,且T->0,然后转第2步。 

模拟退火的算法流程图如下:

模拟退火算法新解的产生和接受可分为如下四个步骤:   

第一步是由一个产生函数从当前解产生一个位于解空间的新解;为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。   

第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。   

第三步是判断新解是否被接受,判断的依据是一个接受准则,最常用的接受准则是Metropo1is准则: 若Δt′<0则接受S′作为新的当前解S,否则以概率exp(-Δt′/T)接受S′作为新的当前解S。   

第四步是当新解被确定接受时,用新解代替当前解,这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。   模拟退火算法与初始值无关,算法求得的解与初始解状态S(是算法迭代的起点)无关;模拟退火算法具有渐近收敛性,已在理论上被证明是一种以概率l 收敛于全局最优解的全局优化算法;模拟退火算法具有并行性

如果你对退火的物理意义还是晕晕的,没关系我们还有更为简单的理解方式。想象一下如果我们现在有下面这样一个函数,现在想求函数的(全局)最优解。如果采用Greedy策略,那么从A点开始试探,如果函数值继续减少,那么试探过程就会继续。而当到达点B时,显然我们的探求过程就结束了(因为无论朝哪个方向努力,结果只会越来越大)。最终我们只能找打一个局部最后解B。

模拟退火其实也是一种Greedy算法,但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。以上图为例,模拟退火算法在搜索到局部最优解B后,会以一定的概率接受向右继续移动。也许经过几次这样的不是局部最优的移动后会到达B 和C之间的峰点,于是就跳出了局部最小值B。

根据Metropolis准则,粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT)),其中E为温度T时的内能,ΔE为其改变数,k为Boltzmann常数。Metropolis准则常表示为

\ Metropolis准则表明,在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为:P(dE) = exp( dE/(kT) )。其中k是一个常数,exp表示自然指数,且dE<0。所以P和T正相关。这条公式就表示:温度越高,出现一次能量差为dE的降温的概率就越大;温度越低,则出现降温的概率就越小。又由于dE总是小于0(因为退火的过程是温度逐渐下降的过程),因此dE/kT < 0 ,所以P(dE)的函数取值范围是(0,1) 。随着温度T的降低,P(dE)会逐渐降低。\ 我们将一次向较差解的移动看做一次温度跳变过程,我们以概率P(dE)来接受这样的移动。也就是说,在用固体退火模拟组合优化问题,将内能E模拟为目标函数值 f,温度T演化成控制参数 t,即得到解组合优化问题的模拟退火演算法:由初始解 i 和控制参数初值 t 开始,对当前解重复“产生新解→计算目标函数差→接受或丢弃”的迭代,并逐步衰减 t 值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值 t 及其衰减因子Δt 、每个 t 值时的迭代次数L和停止条件S。

总结起来就是:

  • f( Y(i+1) ) <= f( Y(i) )  (即移动后得到更优解),则总是接受该移动;
  • f( Y(i+1) ) > f( Y(i) )  (即移动后的解比当前解要差),则以一定的概率接受移动,而且这个概率随着时间推移逐渐降低(逐渐降低才能趋向稳定)相当于上图中,从B移向BC之间的小波峰时,每次右移(即接受一个更糟糕值)的概率在逐渐降低。如果这个坡特别长,那么很有可能最终我们并不会翻过这个坡。如果它不太长,这很有可能会翻过它,这取决于衰减 t 值的设定。

关于普通Greedy算法与模拟退火,有一个有趣的比喻:

* * 普通Greedy算法:兔子朝着比现在低的地方跳去。它找到了不远处的最低的山谷。但是这座山谷不一定最低的。这就是普通Greedy算法,它不能保证局部最优值就是全局最优值。 * 模拟退火:兔子喝醉了。它随机地跳了很长时间。这期间,它可能走向低处,也可能踏入平地。但是,它渐渐清醒了并朝最低的方向跳去。这就是模拟退火。

模拟退火算法的简单应用   

作为模拟退火算法应用,讨论货郎担问题(Travelling Salesman Problem,简记为TSP):设有n个城市,用数码1,…,n代表。城市i和城市j之间的距离为d(i,j) i, j=1,…,n.TSP问题是要找遍访每个域市恰好一次的一条回路,且其路径总长度为最短.。   

求解TSP的模拟退火算法模型可描述如下:   

解空间 解空间S是遍访每个城市恰好一次的所有回路,是{1,……,n}的所有循环排列的集合,S中的成员记为(w1,w2 ,……,wn),并记wn+1= w1。初始解可选为(1,……,n)   

目标函数 此时的目标函数即为访问所有城市的路径总长度或称为代价函数:   

我们要求此代价函数的最小值。   

新解的产生 随机产生1和n之间的两相异数k和m,若k\

(w1, w2 ,…,wk , wk+1 ,…,wm ,…,wn)   

变为:

(w1, w2 ,…,wm , wm-1 ,…,wk+1 , wk ,…,wn).   

如果是k>m,则将   

(w1, w2 ,…,wk , wk+1 ,…,wm ,…,wn)   

变为:   

(wm, wm-1 ,…,w1 , wm+1 ,…,wk-1 ,wn , wn-1 ,…,wk).   

上述变换方法可简单说成是“逆转中间或者逆转两端”。   

也可以采用其他的变换方法,有些变换有独特的优越性,有时也将它们交替使用,得到一种更好方法。   

代价函数差 设将(w1, w2 ,……,wn)变换为(u1, u2 ,……,un), 则代价函数差为:

``` clc clear all global box; global cargo; global lambda; global numcargo;global numbox;global solution;

%-------------------------------控制参数---------------------------

lambda = 0.5; % 重量利用率权重

T0 = 100; % 初始温度 T_End = 1; % 终止温度 metropolis = 100; % 退火算法中 metropolis链长度 cooling = 0.98; % 降温系数

pop = 20; %遗传算法染色体数 maxite = 100; %遗传最大迭代次数 pm = 0.1; %遗传变异概率 %--------------------------------------------------------------------

%----------------------------初始化:读取货箱信息 ---------------------------- orginalcargo=load('cargo');box=load('box'); count=1; for i=1:size(orginalcargo,1) %重构货物格式 cargo: 重 长 宽 高 体积 ;其中 长>宽>高 for j=1:orginalcargo(i,2) cargo(count,1:4) = orginalcargo(i,3:6); cargo(count,5) = prod(cargo(count,2:4),2); cargo(count,2:4) = sort(cargo(count,2:4),'descend'); count=count+1; end end
for i=1:size(box,1) %重构箱子box: 重 长 宽 高 体积 box(i,5)=prod(box(i,2:4),2);
end

numcargo=size(cargo,1); % 货物数 numbox=size(box,1); % 货箱数

solution= fix((numbox)*rand(1,numcargo))+1; %随机生成初始解 Scheme=transform(solution); %解转化成“货箱:货物”对应的形式 [feassolution,Scheme]= placement(Scheme); %装箱处理 [PG,PV,gbest ]= evaluate(feassolution) ; %计算适应度

%--------------------------------------------------------------------

%----------------------------退火------------------------ begin=cputime; %开始计时

%遗传算法优化 GENE(染色体数/种群规模,最大迭代次数,染色体长度/维度,变异概率) [finalsolution,gbest]=GENE(pop,maxite,numcargo,pm) ;

%遗传执行完毕后 模拟退火进一步优化 T = T0; while T > TEnd for i=1:metropolis %-----------随机交换两件货物生成新解 newsolution=finalsolution; R1=fix(randnum_cargo)+1; R2=fix(randnumcargo)+1; inter=newsolution(R1); newsolution(R1)=newsolution(R2); newsolution(R2)=inter; NewScheme=transform(newsolution); % 分配货箱 [feassolution,NewScheme]= placement(NewScheme); % 装箱处理 [NPG,NPV,pbest ]= evaluate(feassolution); % 评估新方案 if pbest>gbest gbest = pbest; finalsolution = newsolution; PG = NPG; PV = NPV; Scheme = NewScheme; else if rand < exp( (pbest-gbest)100T0/T) gbest=pbest; final_solution=newsolution; PG = NPG; PV = NPV; Scheme = NewScheme; end end
end T = T * cooling; end

timecost = cputime-begin; %计时结束

%----------------------------输出结果------------------------ result(Scheme,15); %将装箱方案Scheme 按每行15个货物显示

fprintf('重量利用率:\t%5.3f %%\n',PG100); fprintf('空间利用率:\t%5.3f %%\n',PV100); fprintf('综合利用率:\t%5.3f %%\n',gbest*100); fprintf('计算时间:\t\t%5.4f s\n',timecost); disp('图像生成中...') depict( Scheme, 1,'c' ) % ( 方案,画出编号为i箱子,颜色) 颜色:r\g\b\c\m\y\k\w

```

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Matlab科研辅导帮

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值