1)《Learning Named Entity Tagger using Domain-Specific Dictionary》
提出AutoNER模型,主要创新点在于预测关联关系与类别,由于边界判错往往不会影响内部之间的关系,能够减小远程监督噪声;其次修改传统的字典匹配方式,将部分高质量短语设置为unknown,并结合数据裁减字典。
比较有启发性的是预测关联关系与类别结合。
2)《BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant Supervision》
创新点主要有二:其一利用现有语料进行BERT再训练时,引入early stopping避免过拟合;其二提出自适应的方式(文中称为学生教师模型,较为不妥),利用两个同样的再训练BERT模型,其中一个a产生的语料提升第二个模型b的表现,之后将b的参数同步到ab两个模型,重复此过程。
此模型主要可以借鉴的点在于自适应的训练模式,可以用选择一个复杂模型一个简单模型,用简单模型拟合复杂模型的提升效果。
3) 《Simplify the Usage of Lexicon in Chinese NER》
提出LexiconAugmentedNER,主要创新点在于进一步更新编码方式,使编码包含位置信息与种类,对每个字符使用BMES(以该字符起始,以该字符为中间,以该字符结尾,以该字符单独成词)进行编码;其次使用weighted pooling方式。
模型构造简单,可迁移性强。编码方式具有较大借鉴意义。
4)《FLAT- Chinese NER Usin