文章目录
论文基本信息
《Pointer Network Solution Pool: Combining Pointer Networks and Heuristics to Solve TSP Problems》
摘要
本文利用指针网络来提高初始解生成的质量,以解决慢收敛问题和在采用启发式算法求解路径规划问题时陷入局部最优解的趋势。结果表明,优化算法的收敛速度和优化结果得到了提高,可以有效地用于改进VNS等启发式算法在旅行推销员问题中的应用。
1.引言
组合优化问题在过去的几十年里,作为计算机科学和运筹学的一个主要课题,已经得到了广泛的关注。最关键和最实际的困难之一是旅行销售员问题(TSP)。考虑一下一个正在往返到几个地方的推销员。销售员必须参观每个地方一次,并保持参观时间最短。该问题的目的是找到通过所有节点的最短的闭环路径。目标结果是通过所有城市并返回到起点的最短行程。TSP是一个np完全问题和离散或组合优化问题[1],它描述了在特定时间内找到有效、准确的解决方案是多么困难。
解决np硬图优化问题的传统技术包括精确、近似和启发式算法。精确的设计允许算法创建最优解决方案,但它们不适合大规模应用。近似算法往往产生质量保证的解,同时比精确算法具有较弱的最优性保证。启发式算法由于其出色的计算效率而经常被使用,尽管它们通常需要为每个应用程序进行调整和主题专家信息。
一些近似技术和启发式已经被创建来解决np困难问题的复杂性。这些方法是基于机器学习的概念,并为组合优化问题提供了一个实际的答案。其机制包括2-opt启发式[2]、蚁群算法(AC)[3]、遗传算法(GA)[4]、变量邻域搜索(VNS)[5]和林-克尼根启发式(LKH)[6]。它们可以保证产生最佳的结果,但它们通常太耗时,无法使用。
图神经网络(GNN)的发展由于其在图拓扑的信息嵌入和信念传播方面的独特能力,可用于建模组合图问题。因此,一个GNN模型解决了组合优化问题,即TSP [8]。
指针网络为组合优化问题[7]的近似解提供了很大的潜力。为了从城市位置提取属性,指针网络使用lstm作为编码器,并使用注意机制作为解码器[11]。它预测了基于Seq2seq模型详细说明下一步可能的策略,从而得到了一个访问城市的样本。利用执行关键方法训练指针网络模型,在指针网络[12]的RL框架中使用负访问时间作为奖励。
先前的研究已经取得了很有希望的结果。然而,指针网络的训练的特点是早期收敛快,后期效率低;在许多情况下,需要许多情况和时间来训练才能达到最优结果。目前对解决这一问题的研究主要集中在改变指针网络的内部机制,以在一定程度上减少缺陷。然而,关于将启发式算法与指针网络相结合的研究却很少。
本文提出了一种指针网络求解池模型。我们的设计建立在一个指针网络机制上,该机制生成了一个解决方案集,它为可变邻域搜索(VNS)提供了更好的初始解决方案,并改变了其后续搜索的逻辑。
本工作的结构如下。前期工作部分介绍了TSP问题和以往的一些相关工作。方法部分描述了所使用的VNS启发式算法和指针网络算法,并描述了本研究的PNSP模型。然后,本文在实验部分对其基于TSPLIB数据集的实验方法进行了分析。对其性能进行了分析,并与其他优化方法进行了分析和比较,证明了该工作的有效性。
2. PRELIMINARIES
A. Travelling salesman problem(TSP)
B. Previous initial solution generation methods 以前的初始解决方案生成方法
3. METHODS
4. EXPERIMENTS RESULTS AND DISCUSSIONS
5. 总结
TSP问题或旅行销售员问题是研究最广泛的组合优化问题之一。它常用于工商管理、信息技术、网络路由、工程管理和交通规划等多个领域,在运筹学中占有重要地位。因此,设计解决这一问题的有效算法具有很高的研究价值。
本文首先介绍了TSP问题的研究现状。它介绍了一些寻找初始解的方法,然后详细描述了VNS启发式算法和指针网络的原理和细节。为了解决现有算法的不足和缺陷,建立了一个PNSP模型,将两种算法相结合,大大提高了算法的有效性,解决了传统启发式算法趋于局部收敛的问题。最后,将改进后的模型的每次迭代时间与原始模型进行了比较,并将改进后的模型的优化结果与当前各种优秀算法的优化结果进行了比较。
虽然略低于目前公认的最佳算法LKH-3,但我们的算法仍然优于其他同类算法,其性能也优于遗传算法。原算法在每次迭代中收敛快速且容易达到局部最优。相比之下,使用PNSP的算法确保了搜索的广度不会随着迭代而消失。
PNSP模型是一种用来缓解属于局部最优的启发式算法的创新方法。然而,它仍然有优化的空间。人们希望能有更多的实验研究了PNSP模型对其他启发式算法的优化效应,如遗传算法。