NER文献阅读整理

1)《Learning Named Entity Tagger using Domain-Specific Dictionary》

提出AutoNER模型,主要创新点在于预测关联关系与类别,由于边界判错往往不会影响内部之间的关系,能够减小远程监督噪声;其次修改传统的字典匹配方式,将部分高质量短语设置为unknown,并结合数据裁减字典。

比较有启发性的是预测关联关系与类别结合。

2)《BOND: BERT-Assisted Open-Domain Named Entity Recognition with Distant Supervision》

创新点主要有二:其一利用现有语料进行BERT再训练时,引入early stopping避免过拟合;其二提出自适应的方式(文中称为学生教师模型,较为不妥),利用两个同样的再训练BERT模型,其中一个a产生的语料提升第二个模型b的表现,之后将b的参数同步到ab两个模型,重复此过程。

此模型主要可以借鉴的点在于自适应的训练模式,可以用选择一个复杂模型一个简单模型,用简单模型拟合复杂模型的提升效果。

3) 《Simplify the Usage of Lexicon in Chinese NER》

提出LexiconAugmentedNER,主要创新点在于进一步更新编码方式,使编码包含位置信息与种类,对每个字符使用BMES(以该字符起始,以该字符为中间,以该字符结尾,以该字符单独成词)进行编码;其次使用weighted pooling方式。

模型构造简单,可迁移性强。编码方式具有较大借鉴意义。

4)《FLAT- Chinese NER Usin

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值