这是一篇ACL Findings的论文,idea很简单,但却非常奏效。
关系分类旨在预测句子中两个实体间的关系,这篇论文通过实体类型来限制关系的搜索范围。例如两个实体类型都是person
,那么他们的关系就可以排除出生地
,这样就能减少候选关系的数量:
模型结构
算法流程
R ( t s , t o ) = { r ∈ R ∣ ( s , o ) ∈ D r } = { r ∈ R ∣ t s ∈ S ( r ) and to ∈ O ( r ) } \begin{aligned} R_{(t s, t o)} &=\left\{r \in R \mid(s, o) \in D_{r}\right\} \\ &=\{r \in R \mid t s \in S(r) \text { and } \text { to } \in O(r)\} \end{aligned} R(ts,to)={r∈R∣(s,o)∈Dr}={r∈R∣ts∈S(r) and to ∈O(r)}
- 首先根据句子中实体的类型将句子归好组
- 对于每一组,收集所有关系组成一个集合 R ( t s , t o ) R_{(t s, t o)} R(ts,to)
- 针对该关系集合学习一个分类器 f g f_g fg
实验结果
由于该方法是模型无关的,所以作者在两个代表性模型上做了实验:
RECENT
分别比 GCN
和 SpanBERT
高了6.9和4.4,提升还是非常明显的。
Cite
@inproceedings{lyu-chen-2021-relation,
title = "Relation Classification with Entity Type Restriction",
author = "Lyu, Shengfei and Chen, Huanhuan",
booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021",
month = aug,
year = "2021",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2021.findings-acl.34",
doi = "10.18653/v1/2021.findings-acl.34",
pages = "390--395",
}