ICML 2024 | 最高提速1440倍!中科院自动化所15秒用GCN搞定随机规划

34657d6d8cf1bc1825425bcc2c2afa84.gif

©作者 | 吴洋、张一帆

单位 | 中科院自动化所

来源 | 量子位 QbitAI

仅需 15 秒即可搞定随机规划问题,速度比传统方法快了 1440 倍!中科院自动化研究所的新研究,利用 GCN 在此类问题上取得了新突破,论文已入选 AI 顶会 ICML 2024。这意味着,在条件不确定的情况下,也能实现高效决策。

72517c52b694528c1ca50750d6e1f0c7.png

论文题目: 

HGCN2SP: Hierarchical Graph Convolutional Network for Two-Stage Stochastic Programming

收录会议: 

ICML 2024

论文链接: 

https://openreview.net/forum?id=8onaVSFTEj

代码链接: 

https://github.com/samwu-learn/HGCN2SP

不确定性下的决策是一类重要的决策问题,它要求决策者能够充分考虑到所有的随机情况并做出最合理的决策。在数学领域,一种常用的解决方式是随机规划,也就是把随机变量包含在数学规划模型当中。其中,两阶段随机规划(Two-Stage Stochastic Programming, 2SP)作为建模此类决策问题的有效方法,应用十分广泛。

中科院自动化所的这项成果——HGCN2SP 模型(HGCN 代表分层图卷积网络),正是将 2SP 方法与图卷积网络结合,利用模型更高效地实现了此类问题求解。论文第一作者为该所博士生吴洋,张一帆研究员是通讯作者。

35dab3deaac077ec2dd80da15cf7a2c1.png

什么是两阶段随机规划?

随机规划的基本思想是将问题的未来可能情况转化为若干个样本场景,然后对每个样本场景进行优化,最后综合所有场景的优化结果来指导当前决策。其应用领域包括供应链管理、金融投资、能源调度、灾害应急管理等。

而两阶段随机规划,顾名思义就是把这个过程分成了两个阶段。具体来说,这两个阶段分别要做出宏观和微观决策,以最小化总成本或最大化总收益。第一阶段的决策是在不确定性显现之前做出的,目标是优化初始决策以适应未来可能发生的多种情况。第二阶段的决策是在不确定性显现之后进行的,根据第一阶段的决策和实际发生的情况进行调整,以优化整体结果。

通过 2SP 模型,决策者需要在决策过程中充分考虑可能发生的不同场景的影响,从而提高决策的鲁棒性和灵活性,做出更为科学和高效的决策。举个例子,假设我们要从 10 个候选地点中选择一些建立仓库,以满足周边 20 个区域的需求。第一阶段需要决策的是,在这 10 个候选地点中应该选择哪些;第二阶段则要确定仓库和区域间的配送关系,此时的决策变量数量多达 200 个(即仓库 i 是否配送区域 j)。

ac739b753836aa0fe04725ff479eb6cd.png

▲ 图像由DALL·E生成

数学上,2SP 问题通常表示为:

47a15fd31e10dcb2620817db54beddd4.png

其中,Q(x,ξ) 表示在给定第一阶段决策 x 和场景 ξ 下的第二阶段优化问题,其形式为:

b72860e2865741abcff5fceb66948331.png

在实际的求解中,一般会采样 N 个场景计算对应的 Q 值来近似期望。显然 N 越大则近似值越可信,但随着场景数量的增加,问题规模迅速膨胀,会导致求解时间大幅提高。还是用这个仓库选址的问题来说明,为了能做出更好的选址决策,需要将需求、天气、人流、交通等不确定因素考虑在内,而每一个因素的变化都对应着一个场景。这意味着,需要广泛采样 N 个不同场景来尽可能模拟真实情况。

这时,第二阶段总决策变量数会高达 200N 个,使得求解时间极为漫长。事实上,当 N 取 500 时,即使使用最先进的商用求解器 Gurobi,也至少需要 6 个小时才能做出最优的决策。传统方法通常利用随机采样或聚类技术来挑选少量的场景(如 10 或 20)以进行近似求解,虽然减少了时间,但得到的决策质量却往往不理想。基于此,也就有了 HGCN2SP 模型的设计思路——在减少采样场景个数的同时,尽可能近似得到准确结果。

25cc1de6e316d2f7e5b022bae90e45d2.png

用图卷积网络解决2SP问题

研究团队针对两阶段随机规划问题求解,提出了基于层次化图卷积网络的 HGCN2SP 模型。具体的在算法设计方面,团队通过构建层次图来表征 2SP 问题,其中底层的图用来表征每个场景的特性,而顶层的图则用于表征场景之间的关系。

然后,再利用层次化图卷积网络(HGCN),分别挖掘底层场景子图的嵌入信息和顶层场景空间的结构信息,以提取场景表示。基于注意力机制的解码器被用于按序挑选场景,不仅能找到具有代表性的场景来简化问题,还可以通过优化场景的排列顺序来改善单纯形法求解问题时对初始基的选取,进而显著提升求解时间。

190358de7775f3f026eb3a6139b64eac.png

▲ HGCN2SP模型框架

团队还结合强化学习(RL),综合考察决策质量和求解时间来优化模型参数,显著提高了问题求解的效率和质量。在上述的仓库选址问题中,尽管 HGCN2SP 只选取了 10 个场景,但其决策结果与 Gurobi 求解器用 6 个小时做出的决策差距仅为 1.7%,而求解时间仅为 15 秒,相当于速度提升了 1440 倍,充分体现了该方法的有效性。 

另外,在网络设计问题(Network Design Problem, NDP)的实验中,HGCN2SP 仅用已有方法不到一半的时间得到了相近的决策效果。尤其在大规模实例和大量场景情况下,HGCN2SP 依然保持了强大的泛化能力。

b0093b7a47f0958cda1ad883fb2ccb7c.png

HGCN2SP 的提出为解决复杂的 2SP 问题提供了一种新的思路和工具,具有广泛的应用前景。研究团队计划进一步优化模型,降低训练成本,并探索其在更多实际问题中的应用。

更多阅读

a5f4c8c28f6f2a595944eded442508cb.png

923e5348e43892afd313613f00b385e2.png

5ca9babf5505b2f720855f7307f1b3a0.png

357bf4055fb6cea5bc9e3045aca245b3.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

ec4d9cbbd752a89afad539e2ebbebe76.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

·

ef7b11bbee1c05eb7fff7b9208d3e0db.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值