Named Entity Recognition as Dependency Parsing

最新推荐文章于 2023-04-08 19:34:57 发布

「已注销」

最新推荐文章于 2023-04-08 19:34:57 发布

阅读量1.5k

点赞数 1

分类专栏：论文笔记文章标签：深度学习自然语言处理机器学习

本文链接：https://blog.csdn.net/Jeaksun/article/details/123547432

版权

论文笔记专栏收录该内容

59 篇文章 5 订阅

订阅专栏

Named Entity Recognition as Dependency Parsing

将实体识别命名为依赖项解析

Abstract

本文通过biaffine模型为句子输入提供全局视图，对句子中的开始和结束token对进行评分。

code

1 Introduction

嵌套实体：对于Bank of China，其中[China] and [Bank of China]都是实体，这种嵌套实体在ACE04/05和Genia中特别常见
flat 实体：CONLL2002/2003和ontonotes中只包含flat实体，而嵌套实体会被忽略

本文采用依赖关系解析，为每个token预测一个head，并为head-child分配一个关系（将NER重新定义为识别开始和结束索引的任务），同时处理nested和flat两种实体任务。

2 Methods

使用单词嵌入和字符嵌入作为输入
- 为了对单词进行编码，同时采用BERT-large和fast-text嵌入
- 对于字符嵌入，使用CNN对token的字符进行编码
将输出馈送给BiLSTM
- 单词和字符嵌入的串联送入到BiLSTM中，获得单词表示(x)
- 使用两个FFNN为spans的start/end创建不同的表示 $h_s/h_e$
- 与直接使用BiLSTM预测start、end相比，这种方法提高了准确性，因为实体开始和结束的山下文不同。
再提供给biaffine分类器
- 对句子使用biaffine模型来创建 $l\times l\times c$ 的评分张量 $r_m$ ，其中 $l$ 表示句子长度， $c$ 表示NER类别的数量+1（非实体）
- 计算span i 的分数：
  
  $h_s(i)=FFNN_s(x_{s_i})\\ h_e(i)=FFNN_e(x_{e_i})\\ r_m(i)=h_s(i)^TU_mh_e(i)+W_m(h_s(i)\oplus h_e(i))+b_m$
  其中 $s_i,e_i$ 表示span i 的开始和结束指数， $Um\in R^{d\times c\times d},W_m\in R^{2d\times c}$

张量 $r_m$ 提供在 $s_i\le e_i$ 的约束下可以构成命名entity的所有可能span的分数

为每个span分配一个NER类别标签 $y^{'}$ ：
$y^{'}(i)=arg\ max\ r_m(i)$
其中i表示span

然后将非实体以外的类别的跨度按其类别得分 $r_m(i_{j^{'}})$ 大小进行排序

对于nested NER
- 只要实体不与排名较高的实体的边界冲突，则选择该实体（还是只能识别出分数较高的实体）
- 如果出现一个实体的边界与另一个实体有重叠，那么选择得分较高的span
对于flat NER
- 包含或排名在要识别的实体之内的任何实体都不会被选择

将其转化为一个多分类问题，本文采用softmax交叉熵优化模型：
$p_m(i_c)=\frac{exp(r_m(i_c))}{\sum_{\overset{\wedge}{c}=1}^{C}exp(r_m(i_{\overset{\wedge}{c}}))}\\ loss = -\sum_{i=1}^{N}\sum_{c=1}^{C}y_{i_c}logp_m(i_c)$