文献阅读（56）AAAI2021-Graph Game Embedding

学徒刘猛

已于 2022-10-28 12:06:59 修改

阅读量328

点赞数 1

分类专栏：文献阅读文章标签：机器学习数据挖掘

于 2021-10-17 20:13:45 首次发布

本文链接：https://blog.csdn.net/CSDNTianJi/article/details/120815394

版权

文献阅读专栏收录该内容

87 篇文章 32 订阅

订阅专栏

本文是对《Graph Game Embedding》一文的浅显翻译与理解，如有侵权即刻删除。

朋友们，我们在github创建了一个图学习笔记库，总结了相关文章的论文、代码和我个人的中文笔记，能够帮助大家更加便捷地找到对应论文，欢迎star~

Chinese-Reading-Notes-of-Graph-Learning

更多相关文章，请移步：文献阅读总结：网络表示学习/图学习

Title

《Graph Game Embedding》

——AAAI2021

Author: Xiaobin Hong

总结

文章将博弈论的思想引入到图嵌入中，通过将节点视为玩家，边视为玩家间的交互，节点嵌入视为玩家选择的策略，来用博弈的思想学习节点嵌入，其优化目标即使得所有玩家选择的策略共同达到纳什均衡。(Game Theory即博弈论，但Game Learning也有游戏学习的称呼，在此为避免混淆，将Game统称为博弈。)

1 策略推演

给出一个无向图G=(V,E),博弈学习的目的在于为每个玩家（节点）v_i学习一个策略空间（即嵌入空间）S_i，当玩家选定一个策略后，要给出正向或负向的收益，对收益（奖励）的评估，需要构造一个效用函数U_i，对该函数的理论定义如下：

在这里插入图片描述

其中，-i指的是除了i之外的所有节点（后续部分公式不再给出，只介绍大意）。
事实上，文章默认每个玩家的策略空间都是相同的，那么训练目标就变成了为每个玩家学习一个严格的占优策略列表（即最优策略），即选择这一策略时玩家能够获得的收益最大，并且能够保证纳什均衡。在博弈论中，纳什均衡是一个非合作博弈的提议解决方案，涉及两个或多个参与者，其中假设每个参与者都知道其他参与者的均衡策略，没有玩家可以通过改变他们自己的策略来获得任何收获。在当前场景下，当每个玩家的策略列表共同达到纳什均衡后，就意味着节点嵌入的优化收敛了。

此外，由于直接计算玩家的最优策略计算量较大，因此文章采用类似贪心算法的思想，每一步选择一个更优策略保证收益高出先前，直至收敛。

注意到，在学习过程中，最为重要的即对玩家选择策略的收益评估，也就是效用函数U的构建。在此，文章考虑不同的交互类型，分别讨论了两类效用函数，即点对博弈嵌入和组群博弈嵌入。