快速入门：使用Amazon Bedrock知识库检索器构建高效RAG应用

afTFODguAKBF

于 2024-10-02 00:14:10 发布

阅读量282

点赞数 10

文章标签： python

本文链接：https://blog.csdn.net/afTFODguAKBF/article/details/142676502

版权

快速入门：使用Amazon Bedrock知识库检索器构建高效RAG应用

引言

在当今的快速信息时代，组织需要有效的工具来处理大量数据。Amazon Bedrock的知识库检索器让您可以轻松使用私人数据来定制生成式AI的响应。本文将帮助您了解如何通过Amazon Bedrock知识库检索器来简化RAG（检索增强生成）应用的构建过程。

主要内容

什么是RAG？

RAG是指检索增强生成技术，它结合信息检索和生成技术来提供更相关的响应。这需要将数据转换为向量、存储在特殊的向量数据库中，并建立自定义集成以检索用户查询的相关文本。

Amazon Bedrock的简化流程

通过Amazon Bedrock知识库，您只需将数据放置在Amazon S3中，Bedrock将自动处理将数据导入向量数据库的所有工作。如果没有现有的向量数据库，Bedrock还会为您创建一个Amazon OpenSearch Serverless向量存储。

集成与配置

通过Langchain - Amazon Bedrock集成，您可以使用Retrieve API来从知识库中检索相关结果。以下是配置和使用的一些步骤：

安装langchain-aws包：
```
%pip install -qU langchain-aws
```

实例化检索器：

from langchain_aws.retrievers import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id="PUIJP4EQUA",
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

进行查询：

query = "What did the president say about Ketanji Brown?"
retriever.invoke(query)

在链中使用：

from langchain.chains import RetrievalQA
from langchain_aws import Bedrock

model_kwargs_claude = {"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000}
llm = Bedrock(model_id="anthropic.claude-v2", model_kwargs=model_kwargs_claude)

qa = RetrievalQA.from_chain_type(
    llm=llm, retriever=retriever, return_source_documents=True
)

qa(query)