LangChain 38 深入理解LangChain 表达式语言三实现RAG检索增强生成 LangChain Expression Language (LCEL)

最新推荐文章于 2024-08-12 13:30:40 发布

AI架构师易筋

最新推荐文章于 2024-08-12 13:30:40 发布

阅读量1.3k

点赞数 28

分类专栏： LLM-Large Language Models 文章标签： langchain 数据库 chatgpt LLM prompt python

本文链接：https://blog.csdn.net/zgpeace/article/details/135206125

版权

LLM-Large Language Models 专栏收录该内容

185 篇文章 121 订阅

订阅专栏

文章介绍了如何在LangChain中使用RAG技术，结合检索、模型和输出解析器，实现在回答问题时增加上下文的示例。涉及到的组件如RunnableParallel、DocArray和ChatModel等在示例中发挥了关键作用。

摘要由CSDN通过智能技术生成

LangChain系列文章

在这里插入图片描述

1. RAG 检索增强生成链搜索示例

对于我们的下一个示例，我们希望运行一个RAG retrieval-augmented generation检索增强生成链，以在回答问题时添加一些上下文。
在这里插入图片描述

# Requires:
# pip install langchain docarray tiktoken

from langchain.chat_models import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.prompts import ChatPromptTemplate
from langchain.vectorstores import DocArrayInMemorySearch
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnableParallel, RunnablePassthrough

from dotenv import load_dotenv  
load_dotenv()  

vectorstore = DocArrayInMemorySearch.from_texts(
    ["harrison worked at kensho", "bears like to eat honey"],
    embedding=OpenAIEmbeddings(),
)

retriever = vectorstore.as_retriever()

template = """Answer the question based only on the following context:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)
model = ChatOpenAI()
output_parser = StrOutputParser()

setup_and_retrieval = RunnableParallel(
    {"context": retriever, "question": RunnablePassthrough()}
)
chain = setup_and_retrieval | prompt | model | output_parser

result = chain.invoke("where did harrison work?")
print('result >> ', result)

运行报错

pydantic_self.pydantic_validator.validate_python(data, self_instance=pydantic_self)
pydantic_core._pydantic_core.ValidationError: 2 validation errors for DocArrayDoc
text
Field required [type=missing, input_value={'embedding': [-0.0192381..., 0.010137099064823456]}, input_type=dict]
For further information visit https://errors.pydantic.dev/2.5/v/missing
metadata
Field required [type=missing, input_value={'embedding': [-0.0192381..., 0.010137099064823456]}, input_type=dict]
For further information visit https://errors.pydantic.dev/2.5/v/missing

The issue seems to be a conflict in the version of pydantic that gets installed. You want a 1.10.x version, not 2.x. See #12916

In the meantime, I was able to work around this locally with
解决方案
pip install pydantic==1.10.8

正确输出

(develop)⚡ % python LCEL/rag.py                                                                          ~/Workspace/LLM/langchain-llm-app
result >>  Harrison worked at Kensho.

在这种情况下，组成的链条是：

chain = setup_and_retrieval | prompt | model | output_parser

为了解释这一点，我们首先可以看到上面的提示模板接受context上下文和question问题作为要替换的值。在构建提示模板之前，我们希望检索相关文档以及将它们作为上下文的一部分包括进来。

作为初步步骤，我们已经设置了检索器，它使用内存存储，可以根据查询检索文档。这也是一个可运行的组件，可以与其他组件链接在一起，但您也可以尝试单独运行它：

retriever_response = retriever.invoke("where did harrison work?")
print('retriever_response >> ', retriever_response)

输出

retriever_response >>  [Document(page_content='harrison worked at kensho'), Document(page_content='bears like to eat honey')]

然后我们使用RunnableParallel来准备预期的输入，通过使用检索到的文档条目和原始用户问题，使用文档检索器进行文档搜索，并使用RunnablePassthrough来传递用户的问题：

setup_and_retrieval = RunnableParallel(
    {"context": retriever, "question": RunnablePassthrough()}
)

回顾一下，完整的链条是：

setup_and_retrieval = RunnableParallel(
    {"context": retriever, "question": RunnablePassthrough()}
)
chain = setup_and_retrieval | prompt | model | output_parser

通过以下步骤：

首先创建一个包含两个条目的RunnableParallel对象。第一个条目，上下文将包括检索器获取的文档结果。第二个条目，问题将包含用户的原始问题。为了传递问题，我们使用RunnablePassthrough来复制这个条目。
将上面步骤中的字典提供给提示组件。然后它获取用户输入，即问题，以及检索到的文档，即上下文，构建提示并输出一个PromptValue。
模型组件获取生成的提示，并传递给OpenAI LLM模型进行评估。模型生成的输出是一个ChatMessage对象。
最后，output_parser组件接收一个ChatMessage，并将其转换为Python字符串，然后从invoke方法中返回。