基于知识图谱的医药领域问答项目QASystemOnMedicalKG

基本资料

项目是找的中科院软件所刘焕勇老师在github上的开源项目,基于知识图谱的医药领域问答项目QASystemOnMedicalKG

该项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱。

我的环境:
  • win10
  • python3.8
  • neo4j数据库
项目流程
  1. 配置好neo4j数据库,记住账号密码。方法:windows下安装Neo4j

  2. 通过build_medicalgraph.py把从网页爬出来的信息导入neo4j数据库,项目中已经有信息了,在data文件夹的medical.json里。这里只需要改下里面的代码:

    class MedicalGraph:
    	def __init__(self):
    	    cur_dir = '/'.join(os.path.abspath(__file__).split('/')[:-1])
    	    self.data_path = os.path.join(cur_dir, 'data/medical.json')
    	    self.g = Graph(
    	        host="127.0.0.1",  # neo4j 搭载服务器的ip地址,ifconfig可获取到
    	        http_port=7474,  # neo4j 服务器监听的端口号
    	        user="neo4j",  # 数据库username,如果没有更改过,应该是neo4j
    	        password="******")  #自己设置的密码
    
    
    	...(中间省略)
    
    
    if __name__ == '__main__':
    	handler = MedicalGraph()
    	handler.create_graphnodes()   # 创建知识图谱实体节点类型
    	handler.create_graphrels()    # 创建实体关系边 
    
    

    导入关系需要较久的时间,可以实时查看neo4j数据库的信息:
    在这里插入图片描述

  3. answer_search.py同样修改neo4j信息

  4. 运行chatbot_graph.py
    在这里插入图片描述

出现的问题
  1. ‘gbk’ codec can’t decode byte 0xa3 in position 29: illegal multibyte sequence
    在open函数里面加上encoding='UTF-8’
    在这里插入图片描述
  2. 需要运行Neo4j后项目才能正常运行。
    在对应路径执行 neo4j.bat console 命令
    在这里插入图片描述
  • 1
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值