Machine-Learning–Based Column Selection for Column Generation

最新推荐文章于 2023-08-21 15:38:28 发布

infinitor

最新推荐文章于 2023-08-21 15:38:28 发布

阅读量823

点赞数 1

分类专栏：机器学习与组合优化

本文链接：https://blog.csdn.net/rivalsx/article/details/119007158

版权

本文探讨了在列生成算法中如何通过机器学习加速收敛，特别是使用图神经网络（GNN）进行列选择。在列生成迭代中，选择合适的列可以减少迭代次数，提高算法效率。作者构建了一个MILP模型来选择最有潜力的列，并用GNN学习这一过程，以减少MILP求解所需的时间。实验结果显示，GNN模型在车辆和机组调度问题以及有时间窗口的车辆路径问题中，相比于传统方法能显著减少计算时间。

摘要由CSDN通过智能技术生成

论文阅读笔记，个人理解，如有错误请指正，感激不尽！仅是对文章进行梳理，细节请阅读参考文献。该文分类到Machine learning alongside optimization algorithms。

01 Column Generation

列生成 (Column Generation) 算法在组合优化领域有着非常广泛的应用，是一种求解大规模问题 (large-scale optimization problems) 的有效算法。在列生成算法中，将大规模线性规划问题分解为主问题 (Master Problem, MP) 和定价子问题 (Pricing Problem, PP)。算法首先将一个MP给restricted到只带少量的columns，得到RMP。求解RMP，得到dual solution，并将其传递给PP，随后求解PP得到相应的column将其加到RMP中。RMP和PP不断迭代求解直到再也找不到检验数为负的column，那么得到的RMP的最优解也是MP的最优解。如下图所示：

关于列生成的具体原理，之前已经写过很多详细的文章了。还不熟悉的小伙伴可以看看以下：

02 Column Selection

在列生成迭代的过程中，有很多技巧可以用来加快算法收敛的速度。其中一个就是在每次迭代的时候，加入多条检验数为负的column，这样可以减少迭代的次数，从而加快算法整体的运行时间。特别是求解一次子问题得到多条column和得到一条column相差的时间不大的情况下（例如，最短路中的labeling算法）。

而每次迭代中选择哪些column加入？是一个值得研究的地方。因为加入的columns不同，最终收敛的速度也大不一样。一方面，我们希望加入column以后，目标函数能尽可能降低（最小化问题）；另一方面，我们希望加入的column数目越少越好，太多的列会导致RMP求解难度上升。因此，在每次的迭代中，我们构建一个模型，用来选择一些比较promising的column加入到RMP中：

Let $\ell$ be the CG iteration number
$\Omega_{\ell}$ the set of columns present in the RMP at the start of iteration $\ell$
$\mathcal{G}_{\ell}$ the generated columns at this iteration
For each column $\in \mathcal{G}_{\ell}$ , we define a decision variable $y_p$ that takes value one if column $p$ is selected and zero otherwise