## 引言
知识图谱是揭示复杂关系和模式的强大工具,尤其在非结构化文本中构建时具有独特价值。本文旨在指导您如何从非结构化文本构建知识图谱,并将其作为RAG应用程序中的知识库使用。
⚠️ **安全提示** ⚠️
构建知识图谱需要对数据库执行写访问,这存在固有风险。在导入数据前,请确保对其进行验证和验证。更多安全最佳实践,请参阅[此处](#)。
## 主要内容
### 架构
构建知识图谱的高层步骤包括:
1. **从文本中提取结构化信息**:使用模型从文本中提取结构化的图信息。
2. **存储到图数据库中**:将提取的图信息存储到图数据库中,以支持后续的RAG应用程序。
### 设置
首先,获取所需的包并设置环境变量。在本例中,我们将使用Neo4j作为图数据库。
```bash
%pip install --upgrade --quiet langchain langchain-community langchain-openai langchain-experimental neo4j
注意:可能需要重启内核来使用更新的包。
设置OpenAI API密钥:
import getpass
import os
os.environ["OPENAI_API_KEY"] = getpass.getpass()
接下来,定义Neo4j凭据和连接:
import os
from langchain