论文阅读1：GNN-RAG

在雨中612

已于 2024-07-07 17:13:03 修改

阅读量1k

点赞数 15

分类专栏：论文阅读文章标签：论文笔记

于 2024-07-04 20:45:46 首次发布

本文链接：https://blog.csdn.net/zt0612xd/article/details/140154240

版权

论文阅读专栏收录该内容

2 篇文章

订阅专栏

GNN-RAG arxiv: GNN-RAG: Graph Neural Retrieval for Large Language Model Reasoning

在这里插入图片描述

https://arxiv.org/abs/2405.20139
源码：https://github.com/cmavro/GNN-RAG
明尼苏达大学，公立常春藤

现在还挂载arxiv上

重点：GNN，RAG，QA
主要过程：

给定问题，GNN在稠密的KG子图上抽取候选答案
从kg里找到从问题实体出发，到候选答案实体的最短路径，作为推理路径
转换推理路径为文本作为LLM+RAG的输入

GNN作为子图推理器，抽取重要的图信息
此外，本文还提出了一种抽取增强的技巧。
数据集：WebQSP，CWQ。

背景

KGQA
给定kg $\mathcal{G}$ ，自然语言问题 $q$ ，KGQA任务目标是从 $\mathcal{G}$ 中找到一组正确的答案实体 $\{a\} \in \mathcal{G}$ 。
根据之前的研究 [Lan et al., 2022]，训练时会给出question-answer pairs，但不提供真实的推理路径。

抽取和推理
KG太大了，所以对于问题 $q$ 要抽取个子图 $\mathcal{G}_q$ 。
抽取需要entity linking和neighbor extraction。
理想情况下，所有的正确答案都被子图 $\mathcal{G}_q$ 覆盖。

LLM-based Retriver
RoG（另一个RAG工作）抽取了从question entities到answers的最短路径，用于微调retriever。
基于抽取的路径，微调一个LLM（比如LLaMA2-Chat-7B）来生成给定问题 $q$ 下的推理路径：
$\text{LLM}(\text{prompt},q) \Rightarrow \{r_1, \rightarrow \cdots r_t\}_k$

方法

GNN：
训练时，给定question-answer pairs，把QA当成node- classification任务来训练（判断每个实体是answer还是 not answer），即L层GNN后获得每个实体的分数，然后打分。推理时，把超过一个分数阈值的实体都当成候选答案，并且给出每个answer对应的最短路径（从question entity到当前的answer）。

GNN的message-passing过程：
在这里插入图片描述
$\omega$ 是自定义的消息函数，例如神经网络。

在这里插入图片描述在实验中，本文没有尝试多种GNN架构，而是尝试神经网络的选择。
本文训了2个GNN，一个用的是预训练的 $\text{SBERT}$ ，一个用的是预训练的 $\text{LM}_{SR}$

LLM：
prompt如下
在这里插入图片描述
推理路径是前文说的，从question entities到answer entities的最短路。

Retrieval Augmentation (RA)
GNN retriever 和 LLM-based retriever 结合，来抽取重要信息
实际使用中，GNN retriever抽取的路径、LLM-based抽取的路径结合起来传到LLM中
LLM-based retriver的缺点是，需要多轮生成。

不同的是，消融实验中，GNN-RAG+Ensemble用于抽取路径的两种GNN方案是：