Raki的读paper小记：Bipartite Flat-Graph Network for Nested Named Entity Recognition

最新推荐文章于 2023-10-25 10:00:51 发布

爱睡觉的Raki

最新推荐文章于 2023-10-25 10:00:51 发布

阅读量759

点赞数

分类专栏： NLP 读paper 文章标签：深度学习人工智能自然语言处理神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Raki_J/article/details/122832297

版权

读paper 同时被 2 个专栏收录

83 篇文章 5 订阅

订阅专栏

82 篇文章 10 订阅

订阅专栏

本文介绍了一种创新的嵌套命名实体识别模型BiFlaG，它利用双向图结构考虑内外层信息交互，通过GCN学习内部实体表示并反馈至平面模块。实验结果显示，BiFlaG在SOTA上取得显著优势。模型结构包括平面BiLSTM-CRF和图模块的Bi-GCN，以及图卷积和双向传播策略。

摘要由CSDN通过智能技术生成

Abstract & Introduction & Related Work

研究任务
嵌套NER
已有方法和相关工作
面临挑战
1. 已有的模型只考虑从最内层到外层的信息的单向传递
创新思路
1. 双向考虑了内外层子图之间的信息交互
实验结论
sota

Model

首先给出模型总览图

外层使用BiLSTM + CRF来抽取平面实体，并将抽取出来的特征构成一个图 $G^1$

对于图模块，我们使用GCN，它在潜在实体的起点和终点节点之间迭代传播信息以学习内部实体。最后，从图模块学到的表征被进一步反馈到平面模块，以获得更好的最外层预测。
在这里插入图片描述

Token Representation

首先把word embedding和 char embedding concat起来，然后丢到一个BiLSTM里面得到序列信息，把输出的新特征丢到接下来的模块里面

Flat NER Module

一个BiLSTM + CRF 没什么好说的

Graph Module

Graph Construction

图一就是一个团

图二就是…从node0到nodeN的一个有向图

Bi-GCN

给出一个图G，和它的节点，图特征由 Bi-GCN来学习
在这里插入图片描述
通过下面公式得到两个图的汇聚特征

在得到每个节点的特征后，通过一个两层的fc，最后经过一个softmax来得到实体得分

对于内部实体，使用交叉熵来计算损失

BiFlaG Training

公式（7）中的实体得分M带有句子中每个词对的类型概率。为了进一步考虑从内部实体到外部实体的信息传播，我们使用 $B i - G C N$ 从实体得分M中为平面模块生成新的表示。词对 $t_i , t_j)$ 的最大类型得分 $r_{ij}$ 表示这个span是实体还是非实体，以及作为这种类型的置信度，由最大汇聚得到

在这里插入图片描述
构建出一个新的图 $G^3$ ， $r_{ij} \in E$

第一部分由平面模块构成
在这里插入图片描述
第二部分由新图上做双向图卷积得到

得到最终表示

新的表示丢到平面模块来更新参数并且抽取更好的外部实体

外部损失由两个CRF构成
在这里插入图片描述
整个算法的流程

Loss Function

总的损失函数，其中 $λ_2$ 是平面模块和图形模块的损失之间的权重。在训练阶段，我们将这一总损失降到最低
在这里插入图片描述

Experiment

在这里插入图片描述

在这里插入图片描述

Conclusion

我们的BiFlaG模型也可以通过简单地移除图模块来处理非嵌套结构。就相同的严格设置而言，实证结果表明，我们的模型普遍优于以前的sota

Remark

应用了图结构，感觉整体中规中矩，没啥亮点，或许一定程度上证明了应用图结构的有效性？

爱睡觉的Raki

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Raki的读paper小记：Bipartite Flat-Graph Network for Nested Named Entity Recognition

Abstract & Introduction & Related Work研究任务嵌套NER已有方法和相关工作面临挑战已有的模型只考虑从最内层到外层的信息的单向传递创新思路双向考虑了内外层子图之间的信息交互实验结论sotaModel首先给出模型总览图外层使用BiLSTM + CRF来抽取平面实体，并将抽取出来的特征构成一个图 G1G^1G1对于图模块，我们使用GCN，它在潜在实体的起点和终点节点之间迭代传播信息以学习内部实体。最后，从图模块学到的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。