将csv文件导入neo4j图形数据库操作

最新推荐文章于 2024-04-22 22:29:21 发布

hzq201435

最新推荐文章于 2024-04-22 22:29:21 发布

阅读量3.3k

点赞数 6

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hzq201435/article/details/105159512

版权

python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

目标：将医疗数据按照属性，实体，实体关系分类，用python创建相关结点和关系，导入neo4j数据库，最后将图数据库导出为json格式。

一、处理数据

将有来医生，民福康，网易健康三个网站数据汇总，合并重叠的标题栏。

各网站标题栏如下（黄色和橙色表示标题栏有重合的部分）：

有来医生	民福康	网易健康
科室	科室	科室
疾病名称	疾病名称	疾病名称
相关症状	相关症状	症状
相关检查	相关检查	检查
治疗方法	治疗方法	治疗
发病部位	发病部位	简介
多发人群	多发人群	病因
是否遗传	是否遗传	预防
相关疾病	相关疾病	护理
相关手术	相关手术	并发症
挂号科室	是否属于医保
是否传染
相关药品
相关费用

新建一个excel表格，将各网站信息标题合并成为一个标题栏如下：

手动处理表格，将各网站医疗信息对应标题分别存入新表格，没有的标题信息都为空。
将excel表格导出为csv格式，得到如下csv表格样式

二、建立图型数据库

1. pycharm连接neo4j，创建csv文件对象

安装py2neo库，从中导入Graph，Node，Relationship。并且创建csv文件对象，图形数据库对象。

2. 根据事先划分好的实体，实体属性，实体关系类型，定义各类型对象名称。

其中实体类型：

实体类型	中文含义	对应csv列标
Department	科室	0
Symptom	相关症状	2
Check	相关检查	3
Operation	相关手术	9
Disease	疾病	1
Relative_disease	相关疾病	8
Drug	相关药品	12
Registration_department	挂号科室	10

实体（疾病）属性类型：

属性类型	中文含义	对应csv列标
Name	疾病名称	1
Cure	治疗方法	4
Location_disease	发病部位	5
Multiple_person	多发人群	6
Inherit	是否遗传	7
Infect	是否传染	11
Fee	相关费用	13
Insurance	是否医保	14
Desc	简介	15
Cause	病因	16
Prevent	预防	17
Nurse	护理	18
Complication	并发症	19

实体关系类型：

实体关系类型	中文含义
has_symptom	疾病显示症状
Need_check	疾病所需检查
Relative_Operation	疾病所需手术
Relative_Diseases	疾病的有关疾病
recommand_drug	疾病该吃的药品
Registrat_Department	疾病挂号科室
Belongto_department	疾病属于科室

对图形数据库对象创建实体，实体关系结点

按行读取csv数据且跳过处理第一行数据，创建实体对象，其中疾病实体含有多种不同属性，数字分别表示是第几列的信息。

创建实体关系型结点对象：

在图形数据库中创建实体和关系：

查看图形数据库，并导出为json

Cypher语句输入：match (n) return (n) 查看所有结点

导出；

关注

6
点赞
踩
51

收藏

觉得还不错? 一键收藏
5
评论
将csv文件导入neo4j图形数据库操作

目标：将医疗数据按照属性，实体，实体关系分类，用python创建相关结点和关系，导入neo4j数据库，最后将图数据库导出为json格式。一、处理数据将有来医生，民福康，网易健康三个网站数据汇总，合并重叠的标题栏。各网站标题栏如下（黄色和橙色表示标题栏有重合的部分）：有来医生民福康网易健康科室 ...
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。