前言
系列文章的上一篇我们已经进行了UIE抽取,非结构化知识抽取整理,转化。但是目前仅在于通过分词提取实体、属性、关系,还没有通过大模型来进一步高效率高精准度来提取这些关键字段,因此后续我们都整个流程优化空间都很大,最终我们的目标就是集成数据库以及大模型,对非结构化知识(包含图片,PDF等通过OCR算法识别)自动化抽取,再落库分发接口展示。
目前我们需要进一步认识知识存储数据库,这里使用Neo4j进行讲解演示。如觉得项目有用请不吝支持。
Neo4j简介
1.1. 什么是Neo4j?
Neo4j 是一个开源的图数据库管理系统,它以图形结构存储数据,能够高效处理复杂的连接和关系数据。Neo4j 使用图数据模型来表示数据中的节点、边和属性,使其特别适合构建和存储知识图谱。