A Unified MRC Framework for Named Entity Recognition阅读笔记

最新推荐文章于 2023-05-25 22:03:22 发布

Lyttonkeepgoing

最新推荐文章于 2023-05-25 22:03:22 发布

阅读量502

点赞数

分类专栏：论文阅读笔记文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/m0_53292725/article/details/124737547

版权

论文阅读笔记专栏收录该内容

11 篇文章 1 订阅

订阅专栏

论文地址: https://arxiv.org/pdf/1910.11476.pdf

github：ShannonAI/mrc-for-flat-nested-ner: Code for ACL 2020 paper `A Unified MRC Framework for Named Entity Recognition` (github.com)

总结：将ner任务看成mrc（machine reading comprehension）任务解决实体嵌套问题

如北京大学不仅是一个组织同时北京是一个地点而看成mrc任务的好处在于引入了query这个先验知识比如对于LOC类别我们构造这样的query 找出国家城市等抽象或具体的地点模型通过attention机制对于query中的国家城市词汇学习到了地点的关注信息然后反馈到passage中的实体信息捕捉中提取具有不同类别重叠的两个实体需要回答两个独立的问题和最近打的比赛思路类似 ner和qa有时候就是可以解决同一类型问题的

论文细节写的很详细大概从三个点来讲的

构造query ner向qa转化的关键就在这假设目前我们要预测的实体类别个数为m 则我们需要构造m个不同的query 每个样本相当于扩充了m倍得到m个新的样本关于如何构造query 这个就需要人工来设计了对于通用的location person organization类别可以使用一些简单的query 就像ORG就可以设计为找出公司商业机构社会组织等组织机构
构造训练数据用BERT来做阅读理解任务首先需要构造相应格式的训练数据目前假设我们对每个原始样本构造了m个query 接下来就是将每个query和样本passage进行拼接得到m个不同的bert输入数据如下所示：

[[cls] 找出某某地点[sep]passage中包含地点的一句话[sep]]

经过构造后的一条数据样本是预测一个类别的实体的位置信息

另外在构造数据的时候有很多细节需要注意：

序列长度问题由于bert最长只能接收512长度的序列因此很多情况下都需要截断

对序列进行mask 由于我们搜索实体的范围仅局限与上下文passage 不包括query 但是bert处理的是query+passage整体序列在最后计算loss的时候我们需要将query部分（以及cls，sep、pad等特殊字符）mask掉使其在计算loss时被忽略

损失函数

分别预测实体的开始位置、结束位置以及从开始到结束位置是实体的概率损失函数分为三个部分 L-start L-end L-span

start:每一个token的二分类CE之和（答案开始）

L-end：每一个token的二分类CE之和（答案结束）一样

L-span：答案开始和答案结束组合的二分类CE之和 span loss通过一个二维矩阵来记录真实实体在句子中的（Start，End）位置比如某个实体在文本中的位置是1~3 那么它在二维矩阵的坐标（1,3）则标注为1 然后分别用三个超参控制三个不同loss的比例

然后解释了如何解决实体嵌套的问题

主要就是构造问题的时候用的annotation guideline notes来作为参考进行构造答案 guideline为tag定义类别可以归纳类别和准确为人类标注提供注释防止歧义然后又说了一下为什么选guideline当然最后是guideline最好

模型：就是bert作为baseline

Lyttonkeepgoing

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
A Unified MRC Framework for Named Entity Recognition阅读笔记

论文地址: https://arxiv.org/pdf/1910.11476.pdfgithub：ShannonAI/mrc-for-flat-nested-ner: Code for ACL 2020 paper `A Unified MRC Framework for Named Entity Recognition` (github.com)总结：将ner任务看成mrc（machine reading comprehension）任务解决实体嵌套问题如北京大学不仅是一个组织 ..
复制链接

扫一扫