图结构数据的新突破：GraphiT模型

人工智能大模型讲师培训咨询叶梓

于 2024-09-27 12:45:00 发布

阅读量668

点赞数 10

文章标签：图表示学习 Transformer 图神经网络深度学习人工智能大模型语言模型

本文链接：https://blog.csdn.net/weixin_44292902/article/details/142522860

版权

人工智能咨询培训老师叶梓转载标明出处

尽管图神经网络（GNNs）在处理图数据方面取得了巨大成功，但如何有效地整合图的拓扑结构和节点特征仍然是一个挑战。为了解决这一问题，来自法国格勒诺布尔阿尔卑斯大学的研究者们提出了一种名为GraphiT（Graph Structure in Transformers）的新型模型。该模型的核心思想是将图的结构信息编码进变换器（Transformer）架构中，以期获得比传统GNNs更优的图表示能力。

GraphiT模型的架构和策略

GraphiT模型采用了一种创新的方法来处理图结构数据，该方法通过在变换器（Transformer）架构中编码图的结构信息，以提高图数据的表示能力。

GraphiT使用标准的变换器编码器来处理图数据，将图看作是一组节点特征。核心组件是注意力机制，通过以下公式计算：

其中，Q 和 V 分别是查询和值矩阵，通过学习得到的投影矩阵 W_Q 和 W_V 进行转换。这种设计减少了模型的参数数量，同时保持了性能。

GraphiT引入了一种新颖的位置编码策略，利用图的核矩阵来调制注意力分数，具体如下：

这里，K_r 是图上的核矩阵，用于引入节点间的相对位置信息。通过这种方式，模型能够捕捉节点间的结构相似性，从而有效地编码位置信息。

除了位置编码，GraphiT还通过图卷积核网络（GCKN）来编码图的拓扑结构。GCKN通过枚举节点的局部子结构（例如路径），并使用核嵌入进行编码，从而生成包含更多图结构信息的特征映射。

这里，X(u) 是节点 u 的特征映射，而 ψ 是路径特征 p 的嵌入。这种方法使得模型能够更全面地理解图的局部结构。

想要掌握如何将大模型的力量发挥到极致吗？叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具。实战专家1小时讲解让您轻松上手，学习如何使用 Llama Factory 微调模型。

评论留言“参加”或扫描微信备注“参加”，即可参加线上直播分享，叶老师亲自指导，互动沟通，全面掌握Llama Factory。关注享粉丝福利，限时免费录播讲解。