模拟退火解决背包问题

问题重述 

经典解法:整数规划 

        如图为清风老师讲义中的背包问题 ,其给出的解法为整数规划,代码如下:

%% 背包问题(货车运送货物的问题)
c = -[540 200 180 350 60 150 280 450 320 120];  % 目标函数的系数矩阵(最大化问题记得加负号)
intcon=[1:10];  % 整数变量的位置(一共10个决策变量,均为0-1整数变量)
A = [6 3 4 5 1 2 3 5 4 2];  b = 30;   % 线性不等式约束的系数矩阵和常数项向量(物品的重量不能超过30)
Aeq = []; beq =[];  % 不存在线性等式约束
lb = zeros(10,1);  % 约束变量的范围下限
ub = ones(10,1);  % 约束变量的范围上限
%最后调用intlinprog()函数
[x,fval]=intlinprog(c,intcon,A,b,Aeq,beq,lb,ub)
fval = -fval

模拟退火

        我尝试了一下用模拟退火求解,也可得到相同的答案,下面为求解过程。模拟退火是一种材料退火过程的仿真优化算法,通过Matropolis准则对随机解进行筛选与迭代,从而完成最优解的求解的方法。

        着重介绍一下metropolis准则,这也是模拟退火算法的重点所在。Metropolis  准则在物理上是指在温度下降过程中,粒子的移动产生了新的状态,若新状态的能量更小,则接受新状态,反之,考虑热运动的影响,就以某个概率判断是否接受新状态。在模拟退火算法的搜索过程中,如果算法在某个区域得到了一个适应度值比当前解更差的新解,就使用 Metropolis  准则判断是否接受新解。通过使用 Metropolis  准则,模拟退火算法可以接受较差的解,具备了跳出局部最优陷阱的能力。

        对于背包问题,初始解的生成可以采用数组形式,这一点和我之前文章中处理旅行商问题是一样的。不同点在于,此处生成的是0-1序列,因为背包问题解决的根本逻辑是整数规划中的0-1规划。新解的产生只要随机将序列中的0变成1或1变成0即可。这时候便产生一个新的问题,新解中多少个0变成1和多少个1变成0是最有效率的?这也是在该问题中算法优化的主要方向。

参数设定

        将各个物理参数和目标参数用类的形式整合在一起,一目了然。模拟退火的外在框架是一个马尔可夫链。每一个温度下,新解的产生都是一个马尔科夫链循环。马尔科夫链即无记忆序列,在同一温度下多次计算可以保证结果的稳定性,但马尔科夫链太长算法的速度便不能保证。其他参数为固体退火基本参数,详细参考模拟退火物理原理,此处不做过多解释。惩罚系数作用于罚函数,此处笔者也不是很了解,一般取1.5。

%% 背包问题
clear;clc

%% 设置求解问题的参数
problem.numVar = 10;       %变量个数
problem.fun = @(x)obj_fun(x); %优化目标函数名称
problem.fun_CV = @(x)obj_fun_CV(x);  %约束条件

%% 模拟退火的参数
SAParameters.temperature = 100;% 初始温度 设置的足够大的话,可以在初始拥有更好的性能
SAParameters.kb = 0.3; % 温度系数
SAParameters.alpha = 0.9; % 降温系数
SAParameters.penalty = 1.5; % 惩罚系数
SAParameters.num = 100; % 马尔可夫链长度
SAParameters.Tmin = 1; % 结束温度
 

目标函数

        参考0-1规划模型。决策变量x是个长度为10的序列,只包含0或1。0代表不运送该货物;1代表运送该货物。货物价值写在矩阵c中,通过与0-1矩阵的点乘便可求出总价值。具体写法如下:

function f = obj_fun(x) % 目标函数
    c = -[540 200 180 350 60 150 280 450 320 120]; 
    f = c.*x;
    f = sum(f);
end

罚函数

        约束条件为所装所有货物重量小于等于30。因此要对货物质量大于30的解进行惩罚。A为各货物的重量矩阵,通过与0-1矩阵的点乘便可求出货物总重量。具体写法如下:

function CV = obj_fun_CV(x)  % 约束条件函数
    A = [6 3 4 5 1 2 3 5 4 2];
    g1 = sum(A.*x)-30;
    G1 = (g1>0)*g1; % 大于30时候对其进行惩罚
    CV = G1;
end

初始解生成

        初始解必须是一个可行解,因此全部为1的序列肯定不行,需要对序列进行随机扰动,并且让该序列的解满足罚函数值为0(即满足约束条件)。

%% 解的初始化,产生一个可行解
variables = ones(1,10);
while 1
    temp = ceil(rand.*problem.numVar);
    variables(temp) = ~variables(temp);
    CV = problem.fun_CV(variables);
    if CV == 0
        break
    end
end
var_final = variables; % 初始化最终最优解
T = SAParameters.temperature; % 初始化温度
E0_OBJ = problem.fun(variables); % 初始化目标函数值
E0_CV = problem.fun_CV(variables); % 初始化CV值
E0 = E0_OBJ+SAParameters.penalty*E0_CV; % 最终目标值
E_OBJ_f = E0; % 初始化最佳温度

退火过程

        通过随机扰动,随机将序列中的1变成0或0变成1,作为新解。此处有很大优化空间,直接决定算法的速度。笔者此处是对整个序列进行随机01变动,但这种方法显然很慢。不过暂时没有想到更好的方法。。。

%% 退火过程
while (T>=SAParameters.Tmin) % 开始降温
    for i = 1:SAParameters.num % 马尔科夫链
        variables_temp = variables; % 用于暂时存放原来的解 
		%% 新解的产生,随机扰动法
        temp = ceil(rand.*problem.numVar);
        variables(temp) = ~variables(temp);
        %% 移动后的目标值计算
        E_OBJ = problem.fun(variables); % 移动后的目标函数值
        E_CV = problem.fun_CV(variables); % 移动后的CV值
        E = E_OBJ+SAParameters.penalty*E_CV;
        dE = E-E0;
        if (E_OBJ<=E_OBJ_f && E_CV==0)
           var_final = variables; % 适应度更小且满足约束条件,保留解
           E_OBJ_f=E_OBJ;
        end
        prob=exp(-dE/SAParameters.kb/T);
        if(dE>0 && rand()>prob)
            variables = variables_temp; % 不满足Metropolis准则,还原解
        end
        E0_OBJ=problem.fun(variables); %初始目标函数值
        E0_CV=problem.fun_CV(variables); %初始CV值
        E0=E0_OBJ+SAParameters.penalty*E0_CV;
    end
T = T*SAParameters.alpha; % 降温
end
E_OBJ_f = -E_OBJ_f;

总代码 

%% 背包问题
clear;clc

%% 设置求解问题的参数
problem.numVar = 10;       %变量个数
problem.fun = @(x)obj_fun(x); %优化目标函数名称
problem.fun_CV = @(x)obj_fun_CV(x);  %约束条件

%% 模拟退火的参数
SAParameters.temperature = 100;% 初始温度 设置的足够大的话,可以在初始拥有更好的性能
SAParameters.kb = 0.3; % 温度系数
SAParameters.alpha = 0.9; % 降温系数
SAParameters.penalty = 1.5; % 惩罚系数
SAParameters.num = 100; % 马尔可夫链长度
SAParameters.Tmin = 1; % 结束温度
 
%% 解的初始化,产生一个可行解
variables = ones(1,10);
while 1
    temp = ceil(rand.*problem.numVar);
    variables(temp) = ~variables(temp);
    CV = problem.fun_CV(variables);
    if CV == 0
        break
    end
end
var_final = variables; % 初始化最终最优解
T = SAParameters.temperature; % 初始化温度
E0_OBJ = problem.fun(variables); % 初始化目标函数值
E0_CV = problem.fun_CV(variables); % 初始化CV值
E0 = E0_OBJ+SAParameters.penalty*E0_CV; % 最终目标值
E_OBJ_f = E0; % 初始化最佳温度

%% 退火过程
while (T>=SAParameters.Tmin) % 开始降温
    for i = 1:SAParameters.num % 马尔科夫链
        variables_temp = variables; % 用于暂时存放原来的解 
		%% 新解的产生,随机扰动法
        temp = ceil(rand.*problem.numVar);
        variables(temp) = ~variables(temp);
        %% 移动后的目标值计算
        E_OBJ = problem.fun(variables); % 移动后的目标函数值
        E_CV = problem.fun_CV(variables); % 移动后的CV值
        E = E_OBJ+SAParameters.penalty*E_CV;
        dE = E-E0;
        if (E_OBJ<=E_OBJ_f && E_CV==0)
           var_final = variables; % 适应度更小且满足约束条件,保留解
           E_OBJ_f=E_OBJ;
        end
        prob=exp(-dE/SAParameters.kb/T);
        if(dE>0 && rand()>prob)
            variables = variables_temp; % 不满足Metropolis准则,还原解
        end
        E0_OBJ=problem.fun(variables); %初始目标函数值
        E0_CV=problem.fun_CV(variables); %初始CV值
        E0=E0_OBJ+SAParameters.penalty*E0_CV;
    end
T = T*SAParameters.alpha; % 降温
end
E_OBJ_f = -E_OBJ_f;

最终结果

模拟退火结果

        这是模拟退火过程求得的结果。

 整数规划结果

      

结论

        结果相同,证明该模拟退火算法程序是正确的。当然此题比较简单,如果数据更复杂,该算法程序的正确性和效率还有待考察。主要优化空间还在于新解的产生上。笔者在此抛砖引玉,读者若有好想法也可以在评论区交流。

  • 6
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是用 C++ 实现的模拟退火算法解决 01 背包问题的示例代码: ```c++ #include <iostream> #include <cmath> #include <ctime> #include <cstdlib> using namespace std; const int maxn = 1005; int v[maxn], w[maxn]; // v[i] 表示第 i 个物品的价值,w[i] 表示第 i 个物品的重量 int n, c; // n 表示物品数量,c 表示背包容量 double ans; // 最大价值 int ansx[maxn]; // 最优解 int x[maxn]; // 当前解 double t = 100; // 初始温度 const double delta = 0.98; // 降温系数 const double eps = 1e-8; // 终止温度 double rand01() { // 生成 0 到 1 之间的随机数 return rand() / (double)RAND_MAX; } void init() { // 初始化 srand(time(NULL)); ans = 0; for (int i = 1; i <= n; i++) { x[i] = rand01() > 0.5 ? 1 : 0; // 随机初始化解 ansx[i] = x[i]; ans += x[i] * v[i]; } } double evaluate(int x[]) { // 计算当前解的价值 double value = 0; int weight = 0; for (int i = 1; i <= n; i++) { value += x[i] * v[i]; weight += x[i] * w[i]; } if (weight > c) { // 如果超过背包容量,则价值为负无穷大 value = -1e9; } return value; } void SA() { // 模拟退火算法 while (t > eps) { // 终止温度 int i = rand() % n + 1; // 随机选择一个位置 int j = rand() % n + 1; int delta = evaluate(x); // 计算当前解的价值 swap(x[i], x[j]); // 交换两个位置的值 delta = evaluate(x) - delta; // 计算新解的价值与旧解的价值之差 if (exp(-delta / t) < rand01()) { // 根据概率接受新解 swap(x[i], x[j]); // 恢复旧解 } else { // 更新最优解 if (evaluate(x) > ans) { ans = evaluate(x); for (int k = 1; k <= n; k++) { ansx[k] = x[k]; } } } t *= delta; // 降温 } } int main() { cin >> n >> c; for (int i = 1; i <= n; i++) { cin >> v[i] >> w[i]; } init(); // 初始化 SA(); // 模拟退火算法 cout << ans << endl; for (int i = 1; i <= n; i++) { cout << ansx[i] << " "; } cout << endl; return 0; } ``` 这段代码首先通过 `rand01()` 函数生成随机解,然后使用模拟退火算法不断更新解,直到达到终止温度 `eps`。在每次更新解时,随机选择两个位置交换值,计算新解的价值与旧解的价值之差,根据概率接受新解或恢复旧解,并更新最优解。在降温时,使用降温系数 `delta` 乘以当前温度。最后输出最大价值和最优解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kummunist

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值