ACL2020-知识图谱论文-NER(一)

1、Named Entity Recognition without Labelled Data: A Weak Supervision Approach
 
摘要:本文提出了一种简单但强大的方法来学习NER模型,在缺乏标签数据,通过薄弱的监督。该方法依赖于广泛的标签功能来自动标注来自目标域的文本。这些注释然后使用隐藏马尔科夫模型合并在一起,该模型捕获了标签函数的不同准确性和混淆性。在此统一标注的基础上,最终可以训练序列标记模型。我们从两个方面来评价这个方法(CoNLL 2003和来自路透社和彭博社的新闻文章),并证明与域外神经NER模型相比,实体级F1得分提高了约7个百分点。
结论
针对命名实体等序列标记任务,提出了一种弱监督模型识别。为了利用任务可用的所有可能的知识来源,该方法使用广泛的标签功能,包括数据驱动的NER模型、地名词典、启发式功能和实体之间的文档级关系。标签功能可以专门识别特定的标签,而忽略其他的标签。此外,不同于以前薄弱的监督方法,标记功能可以产生概率预测。这些标记函数的输出,然后合并在一起使用隐藏马尔科夫模型,其参数估计与鲍姆-韦尔奇算法。在这些统一预测的基础上,最终可以学习神经序列标记模型。
 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值