基于neo4j知识图谱+flask的大数据医疗领域知识问答系统(完整源码+源码解析+开发文档+视频讲解等资料(1)

本文介绍了一个医疗领域知识问答系统,利用Neo4j构建知识图谱,Flask作为前端,MongoDB存储数据。系统爬取疾病信息并存储到MongoDB,采用最大向前匹配和Aho-Corasick算法进行数据处理。此外,文章讨论了知识图谱的实体类型、关系类型和属性类型,并提供了构建图谱的步骤。
摘要由CSDN通过智能技术生成

之前老版本的insert方法被弃用,再用会出现警告。insert 替换为了 insert_one,这样就不会再收到关于 insert 方法被弃用的警告了。如果你需要一次性插入多个文档,可以使用 insert_many 方法。

# 使用 insert\_one 或 insert\_many 方法。提供了更多的灵活性,并且支持更多的功能,比如插入后返回的文档的 \_id 值。
class MedicalSpider:
    def __init__(self):
        # 在类初始化时,建立与 MongoDB 数据库的连接
        self.conn = pymongo.MongoClient()

        # 选择名为 'medical2' 的数据库
        self.db = self.conn['medical']

        # 在数据库中选择名为 'data' 的集合(类似于关系数据库中的表)
        self.col = self.db['data']

    def insert_data(self, data):
        # 使用 insert\_one 方法插入单个文档
        self.col.insert_one(data)



  1. class MedicalSpider:: 定义了一个名为 MedicalSpider 的类。
  2. def init(self):: 这是类的构造函数,用于在创建类的实例时进行初始化。在初始化过程中,建立了与 MongoDB 数据库的连接,并选择了名为 ‘medical’ 的数据库和名为 ‘data’ 的集合。
  3. def insert_data(self, data):: 这是一个方法,用于插入数据到 MongoDB 中。它使用了 insert_one 方法,该方法用于插入单个文档(记录)到 MongoDB 集合中。data 参数是要插入的文档数据。
    在这里插入图片描述

需要爬取的信息包括疾病名、所属目录、症状、治疗方案等等,都可以从页面上获取。
在这里插入图片描述

MongoDB里面的数据也是刷新显示最新数据记录
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/ef684bdce53645b88055248552f9c444.png

我们随便点一个我们爬取的网页链接,点击查看网页详情:

  • 9
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值