揭秘聊天文档：从ConversationalRetrievalChain迁移到LCEL

最新推荐文章于 2024-09-26 11:32:48 发布

afTFODguAKBF

最新推荐文章于 2024-09-26 11:32:48 发布

阅读量379

点赞数 3

文章标签：服务器前端运维 python

本文链接：https://blog.csdn.net/afTFODguAKBF/article/details/142330391

版权

引言

在日益发展的人工智能领域，能有效处理和检索文档的系统如ConversationalRetrievalChain变得至关重要。本文将探讨从ConversationalRetrievalChain迁移到LCEL（LangChain Enhanced Library）实现的优势，并通过代码示例帮助您掌握这一过程的细节。

主要内容

为什么选择LCEL？

内部结构更清晰：LCEL更透明，尤其在处理查询重构步骤时。
更灵活的文档返回：支持异步操作和流式处理，使应用程序更高效。
易于定制：更容易实现自定义提示和配置。

迁移步骤

文档加载与向量存储

首先，加载文档并将其转换为向量存储，这是任何检索系统的基础。

import os
from getpass import getpass
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import FAISS
from langchain_openai.chat_models import ChatOpenAI
from langchain_openai.embeddings import OpenAIEmbeddings

os.environ["OPENAI_API_KEY"] = getpass()  # 设置API密钥

# 加载文档
loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
data = loader.load()

# 文本切割
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
all_splits = text_splitter.split_documents(data)

# 向量存储
vectorstore = FAISS.from_documents(documents=all_splits, embedding=OpenAIEmbeddings())
llm = ChatOpenAI()

创建检索链

使用LCEL创建一个支持历史感知的检索器和文档链。

from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain_core.prompts import ChatPromptTemplate

# 问题重构提示
condense_question_system_template = ("Given a chat history and the latest user question "
                                     "which might reference context in the chat history, "
                                     "formulate a standalone question.")

condense_question_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", condense_question_system_template),
        ("placeholder", "{chat_history}"),
        ("human", "{input}"),
    ]
)

history_aware_retriever = create_history_aware_retriever(
    llm, vectorstore.as_retriever(), condense_question_prompt
)

system_prompt = (
    "You are an assistant for question-answering tasks. "
    "Use the following pieces of retrieved context to answer "
    "the question."
    "\n\n"
    "{context}"
)

qa_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_prompt),
        ("placeholder", "{chat_history}"),
        ("human", "{input}"),
    ]
)

qa_chain = create_stuff_documents_chain(llm, qa_prompt)
convo_qa_chain = create_retrieval_chain(history_aware_retriever, qa_chain)

# 执行查询
result = convo_qa_chain.invoke(
    {
        "input": "What are autonomous agents?",
        "chat_history": [],
    }
)

print(result['answer'])