本文是关于中科院软件所刘焕勇老师在Github上的开源项目(QABasedOnMedicaKnowledgeGraph)的搭建.
本项目立足医药领域,以垂直型医药网站为数据来源.
以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱.
项目
项目介绍:医药领域知识图谱快速及医药问答项目
搭建环境中遇到的问题:QABasedOnMedicaKnowledgeGraph
搭建
1. 本文搭建使用环境
- 虚拟环境python3.6 (含库: py2neo、pyahocorasick)
- neo4j 3.5.6
2.下载项目源码
- 见上文项目地址.
3.开启neo4j数据库
- 新建一个图数据库,自定义账号密码.
- 配置相对简单,详情可百度.
Neo4j环境:desktop-1.2.1、community-3.5.5
https://pan.baidu.com/s/13NWRMe-4BUewdUNsHujkjg
提取码:Amme
4.运行 build_medicalgraph.py
- 注意取消注释
- 运行时间稍长,具体看设备和网速,约1.5 hours+
handler.create_graphnodes();
handler.create_graphrels();
5.运行 chatbot_graph.py
End
关于这个项目的搭建,由于网上教程还算挺多的,然后也有一个源码详解版本我觉得写的很好,这里推荐给大家.
最后,欢迎大家交流和指正.