2022/2/10 ACL2021 Locate and Label: A Two-stage Identifier fo Nested Named Entity Recognition
懒得粘图了,参考我的知乎https://zhuanlan.zhihu.com/p/466385935
1 摘要&介绍
当前的NER任务只能应对flat实体,不能应对嵌套(nested)实体。而能应对嵌套实体的模型,也有着高额计算指出、忽略边界信息、文段(span)利用率低的问题。
针对以上困难,文章提出了一个2阶段(two-stage)实体识别器:
①定位实体。具体来说,第一阶段由过滤器和回归器组成。过滤器将种子文段(seed spans)风格成文字文段和span proposal,然后过滤出候选文段(span candicate)。回归器通过调整span proposal的边界来提高候选文段的质量。
②给边界打标签。使用实体分类器给span proposal打标签。
论文的思路借鉴了对象发现(Object Detection)中关于嵌套实体的做法,至于两者为什么相同,见右图,并给出了几个原因:①两者都需要确定ROI(region of interest,感兴趣区域)的位置,并在对应区域上使用策略。
文章的创新点:
将NER看作一个边界回归和片段分类的联合任务。
充分李永乐边界信息来精确定位实体,甚至使用了span级的损失函数。
基于IoU弹性的处理样本数据,而不是简单的把部分匹配的span当做噪音样本。
2 Model
模型步骤
通过encoder得到词表示,然后生成种子sp
[论文笔记]ACL2021 Locate and Label: A Two-stage Identifier fo Nested Named Entity Recognition
最新推荐文章于 2024-04-30 23:23:05 发布