中文电子病例命名实体识别

中文电子病例命名实体识别

CCKS2017中文电子病例命名实体识别项目,主要实现使用了基于字向量的四层双向LSTM与CRF模型的网络.该项目提供了原始训练数据样本(一般醒目,出院情况,病史情况,病史特点,诊疗经过)与转换版本,训练脚本,预训练模型,可用于序列标注研究.

电子病历结构化是让计算机理解病历、应用病历的基础。基于对病历的结构化,可以计算出症状、疾病、药品、检查检验等多个知识点之间的关系及其概率,构建医疗领域的知识图谱,进一步优化医生的工作. CCKS2018的电子病历命名实体识别的评测任务,是对于给定的一组电子病历纯文本文档,识别并抽取出其中与医学临床相关的实体,并将它们归类到预先定义好的类别中。组委会针对这个评测任务,提供了600份标注好的电子病历文本,共需识别含解剖部位、独立症状、症状描述、手术和药物五类实体。 领域命名实体识别问题自然语言处理中经典的序列标注问题, 本项目是运用深度学习方法进行命名实体识别的一个尝试.

实验数据:

一, 目标序列标记集合 O非实体部分,TREATMENT治疗方式, BODY身体部位, SIGN疾病症状, CHECK医学检查, DISEASE疾病实体

二, 序列标记方法 采用BIO三元标记

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
GitHub 的命名实体识别项目医疗是一个用于识别医疗文本中的命名实体的项目。命名实体是指在文本中具有特定意义的名词短语,如人名、地名、时间、机构名等。在医疗领域,准确地识别和提取出这些命名实体对于医学专业人员的研究和工作至关重要。 这个项目利用机器学习和自然语言处理技术,通过构建算法和模型,能够自动识别医疗文本中的各种命名实体。它可以识别出例如医生和患者的名字、医疗机构的名称、疾病和药物的名称、病人的年龄和性别等关键信息。 该项目的开源性质使得任何人都可以查看、使用和贡献。这有助于医疗领域的研究人员、数据科学家和开发者们共同分享和改进命名实体识别的算法和模型。通过社区的参与和反馈,这个项目能够不断地改进和优化,从而提供更准确和可靠的命名实体识别结果。 这个项目的应用前景非常广泛。它可以被应用于医学文献的分析和挖掘,从而帮助研究人员更快地了解和发现医学知识。同时,它也可以被用于医疗记录的自动处理和归档,提高医院管理和病例分析的效率。此外,该项目还可以成为其他人工智能应用的一个重要组成部分,如智能问答系统和虚拟助手,在医疗服务和咨询中为用户提供更好的体验。 总之,GitHub 的命名实体识别项目医疗在医疗领域具有重要的意义,它利用机器学习和自然语言处理技术,能够准确识别医疗文本中的各种命名实体,为医学研究和实践提供有力的支持。通过开源共享和社区的参与,这个项目有望不断改进和扩展,为医疗领域带来更多创新和进步。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值