探索生成式AI的未来：Amazon Bedrock RAG工作坊

张姿桃Erwin

于 2024-09-13 07:56:31 发布

阅读量867

点赞数 17

本文链接：https://blog.csdn.net/gitblog_00018/article/details/142194327

版权

探索生成式AI的未来：Amazon Bedrock RAG工作坊

amazon-bedrock-rag-workshop Workshop Studio 项目地址: https://gitcode.com/gh_mirrors/am/amazon-bedrock-rag-workshop

项目介绍

Amazon Bedrock Retrieval-Augmented Generation (RAG) Workshop 是一个专注于利用基础模型（FMs）和检索增强生成（RAG）技术的实践工作坊。通过Amazon Bedrock，一个完全托管的服务，开发者可以访问来自第三方提供商和亚马逊的基础模型，并通过API进行调用。工作坊旨在帮助开发者深入了解RAG技术，并通过实际操作提升组织的生产力。

项目技术分析

核心技术组件

LLM（大型语言模型）：工作坊中使用的是Anthropic Claude V2，通过Amazon Bedrock提供。该模型用于理解和生成人类友好的文本答案。
嵌入模型：Amazon Titan Embeddings，同样通过Amazon Bedrock提供。该模型用于生成文本数据的数值表示。
文档加载器：包括LangChain提供的PDF加载器和文本加载器，用于从本地路径加载示例文件。
向量存储：使用FAISS、LlamaIndex和ChromaDB等开源软件，支持内存中的向量存储。在企业环境中，可以替换为持久化存储，如AWS OpenSearch、RDS Postgres with pgVector等。
数据分块：将原始数据分割成更小的文本块，以便进行更细粒度的相关性搜索。
索引：向量索引用于比较输入嵌入和文档嵌入，以找到相关文档。
封装器：封装索引、向量存储、嵌入模型和LLM，抽象出底层逻辑。
检索与搜索：包括检索问答（QA）和语义相似性搜索。
编排器：LangChain和LlamaIndex用于协调RAG工作流程的所有部分。