因为硕士研究方向是基于知识图谱的中文医学问答系统,所以调研了下现有的生物医学(BioMedical)和医学(Medical)知识库。
首先需要对上述两个概念做个区分,从我的理解来看,生物医学更加微观,偏向于蛋白质/基因等各种化学物质,面向的是药物假设发现、疾病和基因的关联性等研究性质课题。而医学则更宏观,主要面向疾病、药物、表征、治疗方案等概念及他们间的关系,更适合面向智能问答、医疗助理等应用。由于现有的中文及英文医学知识图谱不多,所以一概而论地进行一下梳理。
首先是一些中文医学的知识图谱
中文医学知识图谱 CMKG
- 该知识库是中科院软件所的刘焕勇老师的工作。
- 来源:寻医问药网上规范的半结构化医学知识
- 规模:包括8807种疾病、3828种药物、5998种症状、3300种检查方法等7类实体、10类关系、10种疾病相关属性,共3万余实体、30余万条关系。数据和搭建方式完全开源,比较适合用来使用
- github
中文医学知识图谱 CMeKG
- 该知识图谱是北大、郑大和鹏程实验室的联合工作
- 来源:是利用自然语言处理与文本挖掘技术,基于大规模医学文本数据,以人机结合的方式研发的中文医学知识图谱
- 规模:包含11076种疾病,18471药物,14794症状&