neo4j的使用(以红楼梦人物关系为例)

参考:知识图谱实战:构建红楼梦知识图谱_任萌新的小生活-CSDN博客_知识图谱构建实战https://blog.csdn.net/RHJlife/article/details/108586578

先对python进行数据操作有一个简单的了解

#导入库
from py2neo import Graph,Node,Relationship,NodeMatcher
import py2neo

#连接数据库
g=Graph('http://localhost:7474',user='neo4j',password='自己的密码')

#新建一个结点,Node(结点名,主属性,其他属性)
test_node_1=Node("Person",name="张三",age=20,sex='男')
#创建结点
g.create(test_node_1)

#不建议用上述创建结点的方式,因为如果执行两次上述语句,会发现同时出现两个结点,我们可以使用覆盖创建,即merge
#创建第2个结点。新建结点,格式为Node(结点名,主属性),然后结点[其他属性]=属性值
test_node_2=Node("Person",name="李四")
test_node_2['age']=21
test_node_2['sex']='男'
g.merge(test_node_2,"Person","name")

#创建第3个结点。新建结点,格式为Node(结点名,主属性,其他属性)
test_node_3=Node("Person",name="王五",age=22,sex='男')
g.merge(test_node_3,"Person","name")

#创建关系,格式为Relationship(结点1,关系,结点2)
relaion_z1=Relationship(test_node_1,'朋友',test_node_2)
relaion_z2=Relationship(test_node_1,'朋友',test_node_3)
relaion_z3=Relationship(test_node_1,'朋友',test_node_4)
g.merge(relaion_z1,"Person","name")
g.merge(relaion_z2,"Person","name")
g.merge(relaion_z3,"Person","name")

#结点匹配
matcher=NodeMatcher(g)
print(matcher.match("Person",name='张三').first())

接下来对红楼梦人物关系就行知识图谱构建,数据集下载地址:红楼梦人物关系 - 图谱 - 开放知识图谱http://www.openkg.cn/dataset/honglou

数据如图

 但是有可能出现乱码

可以这样解决,首先新建一个空白excel,依次执行如下操作

于是就不出现乱码了

 然后保存为CSV文件

将红楼梦的人物关系以知识图谱显示

import csv
import py2neo
from py2neo import Graph,Node,Relationship,NodeMatcher
#账号密码改为自己的即可
g=Graph('http://localhost:7474',user='neo4j',password='自己的密码')
with open('F:\py_dada/Houlou.csv','r',encoding='gbk') as f:
    reader=csv.reader(f)
    for item in reader:
        if reader.line_num==1:
            continue
        print("当前行数:",reader.line_num,"当前内容:",item)
        start_node=Node("Person",name=item[0])
        end_node=Node("Person",name=item[1])
        relation=Relationship(start_node,item[3],end_node)
        g.merge(start_node,"Person","name")
        g.merge(end_node,"Person","name")
        g.merge(relation,"Person","name")

 

  • 4
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学、电子信息等专业的课程设计、期末大作业和毕设项目,作为参考资料学习借鉴。 3、本资源作为“参考资料”如果需要实现其他功能,需要能看懂代码,并且热爱钻研,自行调试。 基于Neo4j的《水浒传》人物关系可视化及问答系统python源码+说明文档+PPT+示例图片.zip #### 简介 基于Neo4j的《水浒传》人物关系可视化及问答系统,该项目可以作为毕业设计,主要用涉及领域包括知识图谱、自然语言处理等知识。运用到的技术架构包括中文自然语言处理技术LTP模型、Python Flask框架、Neo4j图数据库。raw_data是人工合成的数据,spider中的数据是爬取的人物图片数据和人物基本信息数据。 #### 一.项目背景 近年来网络文学蓬勃发展,文学作品的数量和题材层出不穷。一部文学作品的字数通常是超过百万的,这就使得用户仅仅通过自己阅读是很难准确地捕捉到作品中具体的人物关系。如果使用传统的搜索引擎对文学作品中的人物关系进行查询,得到的结果往往都是相对应的大量文字片段的网页链接,无法得到简洁准确的答案。由此,能够弥补上述缺陷的问答系统逐渐受到广泛关注,它不仅允许用户以自然语言的方式进行提问,还能够实现针对用户提问返回相应简洁准确答案句的功能,在一定程度上提高了用户的查询效率。此外,关于中文问答系统的研究还不够成熟,中文语法及语义的复杂性给问答系统研究带来了不小挑战,因此,针对中文的语句相似度研究、文本检索、知识推理等问答系统的应用前景广阔,且有很大发展空间。 #### 二.项目介绍 本项目是对中文问答系统的探索,针对文学作品人物关系复杂,无法进行快速准确查询的问题,本项目提出基于水浒传的人物关系可视化及问答系统,并进行了实例验证,采用分词、句法分析等自然语言处理技术,研究了文学作品水浒传中人物关系,实现了根据用户输入的人物名称快速返回其人物关系的功能,项目功能包括三个主要部分:人物关系检索、人物关系全貌展示和人物关系问答。对于用户提交的问题,首先利用哈工大的语言技术处理平台LTP进行分词,提取关键词;其次,对于已经预处理的数据建立图数据库,然后用分词提取出来的关键字进行Neo4j图数据库的查询,匹配相关信息,利用Python Flask建立前端展示页面,建立知识图谱展示。目前,自然语言处理应用于各个领域,如教育、医疗、司法、金融等等。本项目立足经典著作《水浒传》,爬取水浒传人物数据,构建起一个包含7类实体的水浒传人物关系知识图谱,以及关于水浒传人物关系的问答系统。本项目主要包含以下内容: - 基于neo4j的水浒传人物关系检索查询。 - 基于neo4j的水浒传人物关系全貌查询。 - 基于neo4j的水浒传人物关系问答系统。 #### 三.项目结构 本项目主要分为以下几个模块: 1. spider模块爬取人物资料,包括人物图片images,人物基本信息(别名、性别、籍贯等)json,生成data.json文件。 2. raw_data文件夹是存放数据处理后的三元组文件。 3. neo_db模块创建知识图谱,建立图数据库以及进行知识图谱的查询。 4. KGQA模块是问答系统模块,主要进行分词、词性标注、命名实体识别。 5. templates模块是HTML页面模块,包括欢迎界面、搜索人物关系页面、人物关系全貌页面人物关系问答页面。 6. static模块存放css和js,是页面样式和效果文件。 7. app.py是整个系统的主入口。 #### 四.总体功能设计 #### 五.项目流程 #### 六.成果展示 首页 人物关系检索 人物关系全貌 人物关系问答 #### 七.部署步骤 * 0.安装所需的库 执行pip install -r requirement.txt<br> * 1.先下载好neo4j图数据库,并配好环境。修改neo_db目录下的配置文件config.py,设置图数据库的账号和密码。在cmd中运行neo4j.bat console命令。<br> * 2.切换到neo_db目录下,执行python create_graph.py 建立知识图谱<br> * 3.下载好ltp_3.4.0 模型,[LTP下载](https://pan.baidu.com/s/1rRvIThO6ej0pyvFbvFSWpQ?pwd=cpvn),提取码:cpvn。注意放到根目录下,如:D:\ltp_data_v3.4.0。[ltp简介](http://ltp.ai/)<br> * 4.在KGQA目录下,修改ltp.py里的ltp模型文件的存放目录<br> * 5.运行python app.py,浏览器打开localhost:50

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SU_ZCS

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值