基于 neo4j 知识图谱和规则匹配的肝病问答系统

该项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含 7 类规模为 4.4 万的知识实体,11 类规模约 30 万实体关系的知识图谱。 原始数据包含 8000 多种病,和肝病相关的有 200 多种病。

一、项目介绍

该项目的数据来自垂直类医疗网站寻医问药,使用爬虫脚本 data_spider.py,以结构化数据为主,构建了以疾病为中心的医疗知识图谱,实体规模 4.4 万,实体关系规模 30 万。schema 的设计根据所采集的结构化数据生成,对网页的结构化数据进行 xpath 解析。

项目的数据存储采用 Neo4j 图数据库,问答系统采用了规则匹配方式完成,数据操作采用 neo4j 声明的 cypher。

项目的不足之处在于疾病的引发原因、预防等以大段文字返回,这块可引入事件抽取,可将原因结构化表示出来。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机毕设论文

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值