论文笔记
文章平均质量分 78
Mecthew
这个作者很懒,什么都没留下…
展开
-
A Frustratingly Easy Approach for Joint Entity and Relation Extraction(陈丹琦2020)
概述本文是陈丹琦博士关于实体识别与关系抽取的一篇论文,文本使用了一种pipeline的方式而非joint learning的方式超越了之前的一众模型,在数据集ACE04/05、SciERC达到SOTA。其中:NER使用span-based的模型而非传统序列标注模型(即将句子中所有长度小于等于N的span聚集成一个候选集,再对候选集作分类,每个候选span根据模型生成一个对应的embedding表示)。RE使用“实体边界+实体类型”方法修改输入句子。要点利用Cross-sentence con原创 2021-03-15 01:07:12 · 2627 阅读 · 0 评论 -
Named Entity Recognition with Partially Annotated Training Data(ACL2019)
1. Introduction在一些语料资源匮乏的语种中,可用的数据可能只是部分标注的(部分NE正确标注,部分NE被标注为O),如下图所示:其中标签为NE的token可视为positive instance,标签为O的的token被视为negtive instance,被错分为O的NE就称为False Negative。本文提出了一种基于约束驱动的迭代算法(constraint-driven iterative algorithm)来学习发现噪声数据中的Negative False样例并降低他们的权重原创 2021-03-15 01:00:56 · 260 阅读 · 0 评论 -
Few-shot Learning for Named Entity Recognition in Medical Text(2018)
1. Summary本文对Electronic health records的一些数据集进行了命名实体识别研究。在利用其它相关数据集的基础上,对target dataset只采集10个样例进行few-shot learning,提出了五种提升性能的方法(tricks):(1)layer-wise initialization with pre-trained weights(2)hyperparameter tuning(3)combining pre-training data(4)custom原创 2021-03-15 00:57:14 · 446 阅读 · 0 评论 -
Improving Low-Resource Named Entity Recognition using Joint Sentence and Token Labeling(ACL2020)
1. Summary本文针对low-resource NER任务——小语种电商NER任务,提出了一种使用句子标签(易获得)与token-level NER的联合训练方法,该方法表明联合句子标签可有效提升low-resource NER的识别性能。本文的亮点主要是提出了利用sentence label的联合训练模型,并对attention机制进行了探究实验,发现使用self-learned的放缩因子效果更好。2. Content2.1 联合训练模型如下图所示:其中,句子分类任务与NER任务除输出层均原创 2021-03-15 00:53:21 · 541 阅读 · 7 评论 -
A Survey on Deep Learning for Named Entity Recognition(IEEE Transactions2020)
1. Summary文章主要介绍了NER的资源(NER语料及工具),并从distributed representation for input,context encoder和tag decoder三个维度介绍了目前现有的工作,并调研了目前最具代表性的深度学习方法。最后提出了目前NER系统面临的挑战以及未来的研究方向。2. Introduction(1) NEs通常分为两种:generic NEs (e.g., person and location) and domain-specific NEs原创 2021-03-15 00:47:42 · 246 阅读 · 0 评论