论文阅读
文章平均质量分 94
好奇小圈
华工在读,立志成为一只大佬
展开
-
Sym-NCO: Leveraging Symmetricity for Neural Combinatorial Optimization 学习笔记
基于深度强化学习(DRL)的组合优化(CO)方法(如DRL-NCO)已经展现了超过传统CO解决器的显著优点,因为DRL-NCO能够在没有验证求解器得到监督的情况下学习CO求解器标签。本文展示了一个新的训练方案,Sym-NCO,与现有DRL-NCO方法的性能显著提高。Sym-NCO是一种基于正则化器的训练方案,它在各种CO问题和解决方案中利用了通用的对称性。施加旋转不变性和反射不变性等对称性可以大大提高DRL-NCO的泛化能力,因为对称性是某些CO任务所共享的不变性特征。翻译 2023-03-10 14:33:01 · 670 阅读 · 4 评论 -
Learning Collaborative Policies to Solve NP-hard Routing Problems 学习笔记
最近,深度强化学习(DRL)框架显示出了解决NP-hard路由问题的潜力,如没有特定问题的专家知识的旅行商问题(TSP)。尽管DRL可以用于解决复杂的问题,但DRL框架仍然难以与展示出巨大性能优势的最先进的启发式方法竞争。本文提出了一种新的层次问题解决策略,即学习协作策略(LCP),该策略可以利用播种器(seeder)和修正器(reviser)两种迭代DRL策略有效地找到接近最优的解。翻译 2023-02-26 14:17:33 · 639 阅读 · 3 评论 -
Multi-Decoder Attention Model with Embedding Glimpse for Solving Vehicle Routing Problems 学习笔记
本文提出了一个新颖的深度强化学习方法,来构建车辆路由问题(vehicle routing problems)的启发式算法。具体来说,本文提出了一个多译码器注意力模型(Multi-Decoder Attention Model,MDAM)来训练多种不同的策略,相比只训练一个策略的现有方法,这大幅度增加了找到好的解决方案的机会。一个自定义的b波束搜索策略被设计,以此来充分利用MDAM的多样性。另外,本文基于结构的递归性质,在MDAM提出了一个嵌入Glimpse层,这通过提供更多有信息的嵌入,可以改善每个策略。翻译 2023-02-23 16:53:02 · 461 阅读 · 0 评论 -
Heterogeneous Attentions for Solving Pickup and Delivery Problem via Deep Reinforcement Learning
论文阅读笔记:Heterogeneous Attentions for Solving Pickup and Delivery Problem via Deep Reinforcement Learning翻译 2022-11-25 16:08:23 · 261 阅读 · 0 评论