构建强大的RAG应用：打造智能问答机器人

最新推荐文章于 2024-10-07 01:36:35 发布

bhawfgrcbtwny

最新推荐文章于 2024-10-07 01:36:35 发布

阅读量425

点赞数 3

文章标签： python 开发语言

本文链接：https://blog.csdn.net/bhawfgrcbtwny/article/details/142320855

版权

引言

在大模型（LLMs）的支持下，创建复杂的问答（Q&A）聊天机器人成为可能。这些应用通过使用检索增强生成（RAG）技术，从特定的源信息中回答问题。本文将逐步展示如何构建一个简单的基于文本数据源的Q&A应用，并介绍典型的Q&A架构。我们还会探讨如何使用LangSmith来追踪和理解应用程序。

主要内容

什么是RAG？

RAG是一种通过额外数据增强LLM知识的技术。LLM可以推理广泛的主题，但其知识仅限于训练时的公开数据。要构建能够处理私有数据或新数据的AI应用，需要使用RAG将合适的信息插入模型提示中。

RAG应用的主要组成部分

**索引：**用于从源获取数据并建立索引的流水线。通常离线进行。
**检索与生成：**在运行时使用用户查询从索引中检索相关数据，然后传递给模型。

典型的流程

**加载：**使用Document Loaders加载数据。
**拆分：**将大文档拆分为小块，以便于索引和传递给模型。
**存储：**使用向量存储和嵌入模型存储和索引拆分文档。

检索与生成

**检索：**使用Retriever从存储中获取相关拆分。
**生成：**使用ChatModel/LLM通过提示生成答案。

代码示例

import os
from langchain_community.document_loaders import WebBaseLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings

# 加载、拆分和索引博客内容
loader = WebBaseLoader(web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",))
docs = loader.load()

text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
vectorstore = Chroma.from_documents(documents=splits, embedding=OpenAIEmbeddings())

# 检索和生成
retriever = vectorstore.as_retriever()
prompt = "... your prompt definition ..."

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

rag_chain.invoke("What is Task Decomposition?")