探索对话式RAG：结合历史上下文的智能问答应用

最新推荐文章于 2025-05-01 23:24:04 发布

aehrutktrjk

最新推荐文章于 2025-05-01 23:24:04 发布

阅读量521

点赞数 5

文章标签：前端数据库人工智能 python

本文链接：https://blog.csdn.net/aehrutktrjk/article/details/143602859

版权

# 探索对话式RAG：结合历史上下文的智能问答应用

在构建问答应用时，我们不仅希望能够回答用户即时提出的问题，还希望能够在对话中保持“记忆”，从而理解前后文的关联并提供更准确的回答。在这篇文章中，我们将探讨如何使用对话式检索增强生成（RAG）来实现这一目标。

## 引言

对话式RAG是指在问答系统中结合历史对话信息，通过检索外部知识来增强生成答案的能力。这种方法在处理复杂对话情境时尤为有效，例如用户可能在提问时涉及到先前的对话内容。本文将详细介绍如何构建一个具备此功能的系统。

## 主要内容

### 1. 构建检索链与历史上下文

我们将使用LangChain库来构建一个可以检索相关信息并结合历史上下文的系统。LangChain提供了一种简洁的方式来构建并管理这些复杂的逻辑。

#### a. 构建检索器

首先，我们需要加载文档并创建一个向量存储来支持检索操作。LangChain支持多种向量存储和嵌入方法，本示例中选择使用OpenAI的嵌入和Chroma存储。

```python
from langchain_community.document_loaders import WebBaseLoader
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter

loader = WebBaseLoader(web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",))
docs = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())
retriever = vectorstore.as_retriever()

b. 集成历史对话

为了让系统利用历史对话信息，我们需要对当前问题进行上下文化处理。这意味着我们需要在检索步骤之前，重新表述问题使其包含必要的上下文信息。

from langchain.chains import create_history_aware_retriever
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

contextualize_q_system_prompt = """
Given a chat history and the latest user question
which might reference context in the chat history,
formulate a standalone question which can be understood
without the chat history.
"""

contextualize_q_prompt = ChatPromptTemplate.from_messages([
    ("system", contextualize_q_system_prompt),
    MessagesPlaceholder("chat_history"),
    ("human", "{input}"),
])
history_aware_retriever = create_history_aware_retriever(llm, retriever, contextualize_q_prompt)

2. 构建问答链

接下来，我们将检索到的上下文信息与重新表述的问题结合起来，通过调用大型语言模型（LLM）生成答案。

from langchain.chains.combine_documents import create_stuff_documents_chain

qa_prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    MessagesPlaceholder("chat_history"),
    ("human", "{input}"),
])

question_answer_chain = create_stuff_documents_chain(llm, qa_prompt)
rag_chain = create_retrieval_chain(history_aware_retriever, question_answer_chain)

3. 代码示例

以下是一个简单的示例，展示如何使用上述构建的链条来处理用户的连续提问：

from langchain_core.messages import AIMessage, HumanMessage

chat_history = []

question = "What is Task Decomposition?"
ai_msg_1 = rag_chain.invoke({"input": question, "chat_history": chat_history})
chat_history.extend([
    HumanMessage(content=question),
    AIMessage(content=ai_msg_1["answer"]),
])

second_question = "What are common ways of doing it?"
ai_msg_2 = rag_chain.invoke({"input": second_question, "chat_history": chat_history})
print(ai_msg_2["answer"])