论文地址: https://arxiv.org/pdf/1910.11476.pdf
1.论文目的
该论文主要解决 ""嵌套型"的NER(Nested NER) 的问题.往常的工作中主要是针对非嵌套型”的NER(Flat NER),但是在当遇到嵌套型NER就会有问题.
2.论文tricks
如下图所示的两个例子所示
论文创造性的引入 MRC(Machine Reading Comprehensio) 的思想来解决嵌套型NER的问题.
如上图所示:我们可以对某些实体引入相对应的问题,使模型更明白我们要提取什么实体.这些问题是人为设计的.
(1)模型输入
那么具体的模型输入以bert为例子:
[CLS]question[SEQ]text[SEQ]
(2)loss function
模型的loss function:
- 关于实体start index的loss function
sequence_output, pooled_output, _ = self.bert(input_ids, token_type_ids, attention_mask, output_all_encoded_layers=False)
sequence_heatmap = sequence_output # batch