临床概念提取:方法学综述

 

临床概念提取:方法学综述

摘要

概念提取是自然语言处理(NLP)的一个子领域,其重点是提取感兴趣的概念

介绍

本身医疗领域的概念抽取,使用医学编码和词典的辅助下的命名实体识别。但有两种不同情况:1、一个新型的病症没有记录更新在词典中,也没有编码;2、临床概念的往往可能是复杂的多个实体的集合,例如A chronic lacunar infarct is also noted,都是描述性的词语(概括的不好)

分为四类:基于规则的方法传统机器学习(非深度学习变体)、深度学习混合方法。例如,早期的临床概念提取尝试,即医学语言处理项目,改编自语言串项目,旨在利用语义词典和大量规则集合从医疗记录中提取症状、药物和可能的副作用[12,13]。20世纪90年代统计NLP的兴起和最近深度学习技术的进步[15-17]影响了临床概念提取的方法。尽管取得了这些进展,但由于电子病历数据的复杂性和异质性以及应用范围的多样性,临床概念提取的方法通常被埋在文献的方法部分。没有一种单一的方法被证明是全球有效的。

调查结果2009-2019

规则占48%,混合22%,传统机器学习22%,深度学习8%(我的分析:标注数据实在有限,不支持直接的深度学习,并且2018年bert模型刚刚提出,可能还没有那么火

此外,仅靠疾病分类代码无法解决的疾病子域更有可能采用概念提取技术。(这就是孤独症单一病种下的问题,代码分的不够细致,很多都不能支持抽取,但需求又在

i2b2 2009 medication challenge: Identification of medications, dosages, routes, frequencies, durations, and reasons i2b2 2009用药挑战:确定用药、剂量、途径、频率、持续时间和原因

CRF, SVM, Context Engine

Patrick J, Li M, editors. A cascade approach to extracting medication events. Proceedings of the Australasian Language Technology Association Workshop 2009; 2009.(用药

任务设定

共享任务(共享数据集和目标)

实践(因地制宜):根据疾病和用例的不同,实践环境中的任务可能更加专门化或定义不明确。临床文献注释中位数为251、最小值为100、最大值为8321。大多数研究选择200到600个文档作为研究数据大小。inter-annotator agreement(IAA评估

We encourage interested readers to read articles by Albright et al. [48] and South et al. [53] for more information on the standard annotation process for concept extraction. 以获得更多关于概念提取的标准注释过程的信息。

模型设定

这些特征大致划分为语言特征、领域知识特征、统计特征和一般文档特征。

传统机器学习和混合方法中最常用的三个特征是词汇特征(24%)、句法特征(20%)和本体(13%)。

医学概念规范化旨在将医学提及映射到统一医学语言系统(UMLS)等标准化本体或SNOMED CT等受控词汇表中相应的医学概念。成熟的临床NLP工具,如MedLEE[112]、MetaMap[113]、cTAKES[114]和MedTagger[115],可以使用不同的方法实现规范化,如字典查找方法和应用模式识别的基于规则的方法。

用于将临床叙事转换为结构化数据,包括MedLEE[112]、MetaMap[113]、KnowledgeMap[125]、cTAKES[114]、HiTEX[126]和MedTagger[115]。

评估:具体内容还没认真考虑,因为还没涉及,有需要再进行分析

分析

data and resource availability(数据和资源可用性)

 domain adaptation(领域适应性):迁移学习,多任务学习(小样本的方法)

 model interpretability(模型可解释性),

 system customizability(系统可定制性):当概念定义发生变化或临床指南更新时,每个模型适应的难易程度

 practical implementation(实际实现).

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值