GNN在文本分类上的应用 | (2) Text Level Graph Neural Network for Text Classification

最新推荐文章于 2025-02-22 16:28:16 发布

CoreJT

最新推荐文章于 2025-02-22 16:28:16 发布

阅读量6.1k

点赞数 10

分类专栏： GNN在文本分类上的应用文章标签： Text-Level GNN 文本分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sdu_hao/article/details/104225930

版权

论文下载链接

本篇博客是论文《Text Level Graph Neural Network for Text Classification》的阅读笔记。

目录

1. 简介

在上一篇博客中，我们介绍了TextGCN模型，即用GCN来做文本分类。他有如下的两个问题：

1）TextGCN为整个数据集/语料库构建一个异构图(包括(待分类)文档节点和单词节点),边的权重是固定的(单词节点间的边权重是两个单词的PMI，文档-单词节点间的边权重是TF-IDF)，固定权重限制了边的表达能力，而且为了获取一个全局表示不得不使用一个非常大的连接窗口。因此，构建的图非常大，而且边非常多，模型由很大的内存消耗。

2）上篇博客也提到了，TextGCN这种类型的模型，无法为新样本(文本)进行分类(在线测试)，因为图的架构和参数依赖于语料库/数据集，训练结束后就不能再修改了。（除非将新文本加入到语料库中，更新图的结构，重新训练......一般不会这样做，总之该类模型不能为新文本进行分类）

本篇论文提出了一个新的基于GNN的模型来做文本分类，解决了上述两个问题：

1）为每个输入文本/数据(text-level)都单独构建一个图，文本中的单词作为节点；而不是给整个语料库/数据集(corpus-level)构建一个大图（每个文本和单词作为节点）。在每个文本中，使用一个非常小的滑动窗口，文本中的每个单词只与其左右的p个词有边相连(包括自己，自连接)，而不是所有单词节点全连接。

2）相同单词节点的表示以及相同单词对之间边的权重全局(数据集/语料库中的所有文本/数据)共享，通过文本级别图的消息传播机制进行更新。

这样就可以消除单个输入文本和整个语料库/数据集的依赖负担，支持在线测试(新文本测试)；而且上下文窗口更

最低0.47元/天解锁文章

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。