香侬科技GNN-LM：基于全局信息的图神经网络语义理解模型笔记-CSDN博客

本文链接：https://blog.csdn.net/ResumeProject/article/details/123139720

本文介绍了GNN-LM，一种基于图神经网络的语义理解模型，它将传统NLP的闭卷模式转变为开卷模式，允许在推理过程中参考训练数据。通过K近邻（KNN）寻找相似样例作为邻居，GNN-LM构建输入样例与邻居的关系，从而提升语言模型的性能。此外，结合KNN-LM技术进一步优化了模型的整体表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

LM任务

$Modeling(LM)任务\\ input \ c_t=(w_1，w_1…，w_{t-1}) \\ output \ p(w_t\vert c_t) \\ {\tiny c即context，即由上下文预测下一个单词或字符是什么} \\ 常规方法BaseLM：h_t=f(c_t)\in R^d,p(w_t\vert c_t) =Softmax(Wh_t)\\ Evaluation \ Metric: \href{https://www.zhihu.com/question/58482430}{perplexity}$

本网络

基于图神经网络的语义理解模型的GNN-LM，它将传统的NLP的闭卷模式，转变为开卷模式：在推理过程中允许参考训练数据。

输入的样例为query，首先在训练数据中通过K近邻（KNN）寻找相似的样例为邻居。通过图神经网络GNN建立输入样例与邻居的关系。

在这里插入图片描述

KNN

We further combine GNN-LM with kNN-LM (Khandelwal et al., 2019), an orthogonal technique enhancing language models, to improve the overall performance of our model.¹

在这里插入图片描述