这是中科院软件所刘焕勇老师在github上的一个开源项目
地址:http:// https://github.com/liuhuanyong/QASystemOnMedicalKG
本项目构建了以疾病为中心的医疗知识图谱,实体规模4.4万,实体关系规模30万。并基于此,搭建起了一个可以回答18类问题的自动问答小系统。
 本项目以neo4j作为存储,并基于传统规则的方式完成了知识问答,并最终以cypher查询语句作为问答搜索sql,支持了问答服务。
基于知识图谱的问答框架
基于知识图谱的问答系统应用知识
- 本体构建
 - RDF 生成
 - 问句解析
 - SPARQL 查询
 - 答案生成
 
本项目的问答系统完全基于规则匹配实现,根据问句中的关键词进行匹配,对匹配到的关键词分类问句,然后使用cypher的match去匹配查找neo4j,根据返回数据组装问句回答,最后返回结果。
医药领域知识图谱规模
知识图谱实体类型
| 实体类型 | 中文含义 | 实体数量 | 举例 | 
|---|---|---|---|
| Check | 诊断检查项目 | 3,353 | 支气管造影;关节镜检查 | 
| Department | 医疗科目 | 54 | 整形美容科;烧伤科 | 
| Disease | 疾病 | 8,807 | 血栓闭塞性脉管炎;胸降主动脉动脉瘤 | 
| Drug | 药品 | 3,828 | 京万红痔疮膏;布林佐胺滴眼液 | 
| Food | 食物 | 4,870 | 番茄冲菜牛肉丸汤;竹笋炖羊肉 | 
| Producer | 在售药品 | 17,201 | 通药制药青霉素V钾片;青阳醋酸地塞米松片 | 
| Symptom | 疾病症状 | 5,998 | 乳腺组织肥厚;脑实质深部出血 | 
基于Neo4j的医疗知识图谱问答系统构建
        
                  
                  
                  
                  
该博客介绍了中科院软件所刘焕勇老师的开源项目,该项目构建了一个包含4.4万实体和30万关系的医疗知识图谱,用于支持18类问题的自动问答。知识图谱基于Neo4j存储,问答系统通过规则匹配实现,涉及疾病、症状、药品、检查等多个方面。此外,还提供了项目运行配置、数据导入和问答启动的步骤。
          
最低0.47元/天 解锁文章
                          
                      
      
          
                
                
                
                
              
                
                
                
                
                
              
                
                
              
            
                  
					1015
					
被折叠的  条评论
		 为什么被折叠?
		 
		 
		
    
  
    
  
            


            