基于 neo4j 知识图谱和规则匹配的肝病问答系统

完整资料进入【数字空间】查看——搜索"writebug"

该项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含 7 类规模为 4.4 万的知识实体,11 类规模约 30 万实体关系的知识图谱。 原始数据包含 8000 多种病,和肝病相关的有 200 多种病。

项目是找的中科院软件所刘焕勇老师在 GitHub 上的开源项目,基于知识图谱的医药领域问答项目

链接

一、项目介绍
该项目的数据来自垂直类医疗网站寻医问药,使用爬虫脚本 data_spider.py,以结构化数据为主,构建了以疾病为中心的医疗知识图谱,实体规模 4.4 万,实体关系规模 30 万。schema 的设计根据所采集的结构化数据生成,对网页的结构化数据进行 xpath 解析。

项目的数据存储采用 Neo4j 图数据库,问答系统采用了规则匹配方式完成,数据操作采用 neo4j 声明的 cypher。

项目的不足之处在于疾病的引发原因、预防等以大段文字返回,这块可引入事件抽取,可将原因结构化表示出来。在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值