本任务是CCKS围绕中文电子病历语义化开展的系列评测的一个延续,在CCKS 2017,2018, 2019相关评测任务的基础上进行了延伸和拓展。
本任务包括两个子任务:
(1) 医疗命名实体识别:于给定的一组电子病历纯文本文档,识别并抽取出与医学临床相关的实体提及(entity mention),并将它们归类到预定义类别(pre-defined categories),比如疾病、治疗、检查检验等。 评论里好多同学需要数据集,我放到云盘里了,学习研究需要的话自取即可。数据集链接:ccks数据集,提取码:ydvb
(2) 医疗事件抽取:本任务为中文病历医疗事件抽取任务,即给定主实体为肿瘤的电子病历文本数据,定义肿瘤事件的若干属性,如肿瘤大小,肿瘤原发部位等,识别并抽取事件及属性,进行文本结构化。
1.关于实体识别
2.关于事件抽取
事件抽取可以分为预定义事件