ATTENTION, LEARN TO SOLVE ROUTING PROBLEMS!

ATTENTION, LEARN TO SOLVE ROUTING PROBLEMS!

1、背景

本篇论文基于Transformer模型提出了一个基于注意力层的模型,并采用REINFORCE方法训练模型,来求解以下几种组合优化问题:
旅行商问题(Travelling Salesman Problem, TSP)
车辆路径问题(Vehicle Routing Problem, VRP)
定向问题(Orienteering Problem, OP)
奖金收集旅行商问题(Prize Collecting TSP, PCTSP)

2、基于注意力层的模型

整个文章的大致思路是:把所有点依次输入编码器,然后解码器输出解序列。这里根据TSP问题定义,对于其他问题模型是相同的,但需要相应的修改输入、mask和Decoder的context
模型定义为随机策略p ( π ∣ s )在给定实例s下选择一个解π 。参数化为θ:
在这里插入图片描述
#3、编码器
在这里插入图片描述
编码器首先通过线性映射,然后使用N层注意力层更新嵌入。每一层由两个子层组成,分别是多头注意力层(MHA)和全连接前馈层(FF),对于每个子层,还添加跳跃链接(skip-connection)和批量归一化层(BN)。最后计算图嵌入。

在这里插入图片描述在这里插入图片描述

4、解码器

在这里插入图片描述上下文节点c:解码器在t时刻的上下文有两个源头,一是编码器,二是直到t时刻的输出。每一个TSP问题,由三个部分组成:图嵌入, 初始点、终点(t=1,使用可学习占位符)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值