【毕设】csv+py2neo 将CSV文件中的数据存储到 neo4j 中

最新推荐文章于 2023-06-03 10:55:54 发布

稳得一笔

最新推荐文章于 2023-06-03 10:55:54 发布

阅读量1.2k

点赞数

分类专栏：项目实战文章标签： neo4j csv 知识图谱

本文链接：https://blog.csdn.net/qq_42907802/article/details/115033322

版权

项目实战专栏收录该内容

9 篇文章 0 订阅

订阅专栏

需求：如图将下列数据存储到neo4j中

步骤：

1、启动neo4j数据库neo4j console

2、安装py2neo，pip install py2neo

3、读取csv文件并存储节点

# 导入必要的包
import csv
from py2neo import Graph, Node
from dataProcess.entity.article import Article
from dataProcess.entity.author import Author
from dataProcess.entity.school import School

# 初始化图数据库
g = Graph(auth=('neo4j', '123456'))
g.run('match(n) detach delete n')

print('【neo4j】开始存储文章节点')
f_article = open('../crawl/zhiwang/csv/article.csv', encoding='utf-8')
reader_article = csv.reader(f_article)
header_1 = next(reader_article)
for row in reader_article:
    # row为每一行元素
    if len(row) == 9:
        # print(row)
        article = Article()
        article.title = row[0]
        article.authors = row[1]
        article.summary = row[2]
        article.keys = row[3]
        article.funds = row[4]
        article.doi = row[5]
        article.album = row[6]
        article.special = row[7]
        article.classNo = row[8]
        node = Node('Article', 标题=article.title, 作者=article.authors, 摘要=article.summary, 关键词=article.keys,资助机构=article.funds, doi=article.doi, 专辑=article.album, 专题=article.special, 分类号=article.classNo)
        g.create(node)
print('【neo4j】所有文章节点存储完毕\n')

运行结果如下：

同理存储其他类型的节点：

print('【neo4j】开始存储作者节点')
f_author = open('../crawl/zhiwang/csv/author.csv', encoding='utf-8')
reader_author = csv.reader(f_author)
header_2 = next(reader_author)
for row in reader_author:
    if len(row) == 9:
        # 姓名, 学校, 专业, 总发布量, 总下载量, 专注领域, 作者文献, 导师, 学生
        author = Author()
        author.name = row[0]
        author.school = row[1]
        author.major = row[2]
        author.sum_publish = row[3]
        author.sum_download = row[4]
        author.fields = row[5]
        author.articles = row[6]
        author.teacher = row[7]
        author.students = row[8]
        node = Node('Author', 姓名=author.name, 学校=author.school, 专业=author.major, 总发布量=author.sum_publish,总下载量=author.sum_download, 专注领域=author.fields, 作者文献=author.articles, 导师=author.teacher,学生=author.students)
        g.create(node)
print('【neo4j】所有作者节点存储完毕\n')

print('【neo4j】开始存储学校节点')
f_school = open('../crawl/zhiwang/csv/school.csv', encoding='utf-8')
reader_school = csv.reader(f_school)
header_3 = next(reader_school)
for row in reader_school:
    if len(row) == 4:
        school = School()
        # 名称, 曾用名, 地域, 官网
        school.name = row[0]
        school.name_used = row[1]
        school.region = row[2]
        school.official_website = row[3]
        node = Node('School', 名称=school.name, 曾用名=school.name_used, 地域=school.region, 官网=school.official_website)
        g.create(node)
print('【neo4j】所有学校节点存储完毕\n')

本项目的架构还不太完善，基本思路差不多明确了，预计一个星期完成一个小的Demo

更多源码已经上传至码云，如果代码有需要优化的地方，欢迎各位大佬指点

稳得一笔

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
【毕设】csv+py2neo 将CSV文件中的数据存储到 neo4j 中

需求：如图将下列数据存储到neo4j中步骤：1、启动neo4j数据库neo4j console2、安装py2neo，pip install py2neo3、读取csv文件并存储节点# 导入必要的包import csvfrom py2neo import Graph, Nodefrom dataProcess.entity.article import Articlefrom dataProcess.entity.author import Authorfrom dataProcess.
复制链接

扫一扫

专栏目录