Enriching Pre-trained Language Model with Entity Information for Relation Classification 论文阅读笔记

最新推荐文章于 2023-05-16 22:00:10 发布

zyk9916

最新推荐文章于 2023-05-16 22:00:10 发布

阅读量292

点赞数

分类专栏：论文阅读笔记文章标签： python 人工智能深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zyk9916/article/details/119795572

版权

论文阅读笔记专栏收录该内容

13 篇文章

订阅专栏

这篇笔记介绍了EnrichingPre-trainedLanguageModelwithEntityInformationforRelationClassification的研究，提出通过在实体位置添加特殊标记并结合BERT进行表示学习，以利用实体信息提高关系分类的准确性。实验结果显示，引入实体信息显著提升了F1分数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Enriching Pre-trained Language Model with Entity Information for Relation Classification 论文阅读笔记
（R-BERT关系抽取）

一、核心思想：

关系分类不仅依赖于整个句子的信息，还依赖于具体目标实体的信息。

二、方法：

在这里插入图片描述
1.在实体1左右两侧添加$标记，在实体2左右两侧添加#标记。在句子开头添加[CLS]标记。

2.将句子输入到BERT模块中，得到一系列隐状态H（设维度为d）。设H_i到H_j是实体1的隐状态，H_k到H_m是实体2的隐状态，依次运用平均运算、tanh激活、全连接层处理得到两个实体的最终表示H₁^’和H₂^’：

在这里插入图片描述
这里设置W₁=W₂，b₁=b₂。

3.设H₀是[CLS]标记的隐状态，同样对其运用tanh激活、全连接层处理得到句子的最终表示H₀^’：

在这里插入图片描述
这里，作者将W₀、W₁、W₂的维度均设置为d×d。

4.将三个最终表示H₀^’、H₁^’、H₂^’连接，对其运用全连接层处理、softmax分类：

在这里插入图片描述
W₃的维度为L×3d（L是关系种类数）。

三、实验设置：

使用交叉熵损失函数，且在每次全连接层处理前使用dropout操作。

使用SemEval-2010Task8官方评分脚本评测模型。

BERT模型使用uncased basic model。

在这里插入图片描述
四、消融实验：

只使用句子信息，不使用实体信息，也不给实体定位：F1值81.09。

使用句子信息，使用实体信息，但不给实体定位（即计算H₁^’和H₂^’，但不使用$和#标记）：F1值87.98。

使用句子信息，不使用实体信息，但给实体定位（不计算H₁^’和H₂^’，使用$和#标记）：F1值87.99。

使用句子信息，使用实体信息，且给实体定位（即计算H₁^’和H₂^’，使用$和#标记，即本文的方法R-BERT）：F1值89.25。

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。