2021-06-02

中文医疗命名实体识别(NER)
命名实体识别NER(Named Entity Recognition)
命名实体是一个词或者短语,它可以在具有相似属性的一组事物中清楚标识出某一个事物。
NER则是指在文本中定位命名实体的边界并分类到预定义类型集合的过程。

实体:指代世界上存在上的某个特定事物。
命名实体可以理解为有文本标识的实体。
实体在文本中的表示形式通常被称为实体指代(Mentiion,或者直接被称为指代),语言学层面的概念。

命名实体识别
就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型。
是信息提取,问答系统,句法分析,机器翻译等应用领域的重要基础工具。

输入:是一个句子对应的单词序列s=<w1,w2,…,wn>
输出: 是一个三元集合,每个元组形式为<ls,le,t>,表示s中的一个命名实体,其中ls和le分别表示命名实体在s中的开始和结束位置,t是实体类型。

作用:
1.识别专有名词,为文本结构化提供支持。
2.主体识别,辅助句法分析
实体关系抽取,有利于知识推理

常用方法:
早期:基于规则,基于字典
传统机器学习:HMM,MEMM,CRF
深度学习:RNN-CRF,CNN-CRF
机器方法:注意力模型,迁移学习,半监督学习(最新),减少数据标注任务,在少量标注情况下仍然能很好的识别实体;另一方面迁移学习(Transfer Learning)旨在从源域(通常样本丰富)学到的知识迁移到目标域(通常样本稀缺)上执行机器学习任务。

常见模型:
BiLSTM网络用于迁移学习
双向LSTM的网络可以同时捕捉正向信息和反向信息,使得对文本信息的利用更全面,效果也更好。

BERT-BiLSTM-CRF模型
经典运用于数据挖掘比赛和论文。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值