更多嵌入模型和向量存储选择,来 Amazon Bedrock 知识库体验!

447404328eb9a2ffb437a289400c85b6.gif

本文作者 Antje Barth

 亚马逊云科技首席开发者布道师

在 2023 年的亚马逊云科技 re:Invent 期间,亚马逊云科技宣布 Amazon Bedrock 知识库正式上线。借助知识库,您可以将 Amazon Bedrock 中的基础模型(FM)安全连接到贵公司的数据,以实现检索式增强生成(RAG)。

在过去,我介绍了 Amazon Bedrock 知识库如何为您管理端到端的 RAG 工作流。您只需指定数据位置,选择嵌入模型以将数据转换为向量嵌入,然后让 Amazon Bedrock 在您的亚马逊云科技账户中创建一个向量存储,来存储向量数据,如下图所示。您还可以自定义 RAG 工作流,例如指定自己的自定义向量存储库。

c735e946798109296fdce5ec635d23f9.png

0702fca9fe1e0a2d8648c87dd2a1be9b.png

Amazon re:Invent

扫码了解更多

2e00e6d532fc23fd8f0b3617c8638701.png

Amazon Bedrock 知识库

扫码了解更多

176d98b1d7a9422870b4868076318c99.png

Amazon Bedrock 

扫码了解更多

左右滑动查看更多

从过去到现在,知识库已经进行了多次更新,包括可将 Amazon Aurora PostgreSQL - 兼容版作为除 Amazon OpenSearch 无服务器的向量引擎、Pinecone 和 Redis Enterprise Cloud 之外的又一个自定义向量存储选项。但不止如此,下面我将简单介绍新增的功能。

ac1c31f4b0b06c81524fc1aa7f98d346.png

Amazon Aurora PostgreSQL

兼容版

扫码了解更多

7f7bf9a50dad28ea9f491013ce37d79f.png

Amazon OpenSearch 

无服务器的向量引擎

扫码了解更多

a7aaf1b06361af40cd0c27fb077ef4f6.png

Pinecone

扫码了解更多

899c7b5e7a8b8df19734611f00628b83.png

Redis Enterprise Cloud 

扫码了解更多

左右滑动查看更多

更多嵌入模型选择

嵌入模型可将数据(例如文档)转换为向量嵌入。向量嵌入包括将文档中的文本数据表现为数字形式。每个嵌入都旨在捕获数据的语义或上下文含义。

Cohere Embed v3 – 除 Amazon Titan 文本嵌入之外,您现在还有另外两种嵌入模型可以选择,即 Cohere Embed 英语 和 Cohere Embed 多语言,每种模型都支持 1,024 个维度。

4646556e11866d51109d7d110a707e71.png

Amazon Titan 文本嵌入

扫码了解更多

7d3b5ee52fb4a6bb130d7d43d623e82b.png

Cohere Embed 英语

扫码了解更多

左右滑动查看更多

55b6c72301687992ee9976b67e1ee8d3.png

您可扫码查看 Cohere 博客,了解有关 Cohere Embed v3 模型的更多信息。

81f3513eec5ce90bd9f5924a3f3f207a.png

Cohere Embed v3 模型

扫码了解更多

更多向量存储选择

每个向量嵌入都放入向量存储中,通常还带有其他元数据,例如对从中创建嵌入的原始内容的引用。向量存储为存储的向量嵌入建立索引,从而可以快速检索相关数据。

知识库可为您提供完全托管式的 RAG 体验,包括在您的账户中创建向量存储来存储向量数据。您还可以从支持的选项列表中创建自定义向量存储,并且提供向量数据库索引名称以及索引字段和元数据字段映射。

对于向量存储的更新,我想重点介绍一下这三次更新:在支持的自定义向量存储列表中增加了 Amazon Aurora PostgreSQL 兼容版和 Pinecone 无服务器,以及对现有 Amazon OpenSearch 无服务器集成的更新,有着有助于降低开发和测试工作负载的成本

Amazon Aurora PostgreSQL – 除 Amazon OpenSearch 无服务器的向量引擎、Pinecone 和 Redis Enterprise Cloud 外,您现在还可以选择将 Amazon Aurora PostgreSQL 作为知识库的向量数据库。

fc841606284850a6c08599250ecd95d4.png

Amazon Aurora 是一种关系数据库服务,与 MySQL 和 PostgreSQL 完全兼容。因此现有的应用程序和工具无需修改即可运行。Amazon Aurora PostgreSQL 支持开源 pgvector 扩展,从而可以存储、索引和查询向量嵌入。

针对常规数据库工作负载的许多 Amazon Aurora 功能也同样适用于向量嵌入工作负载:

  • 与开源 PostgreSQL 相比,Amazon Aurora 提供的数据库吞吐量高达前者的 3 倍,并且支持 Amazon Bedrock 中的向量操作。

  • Amazon Aurora Serverless v2 可根据来自 Amazon Bedrock 的实时查询负载弹性扩缩存储和计算容量,从而确保最优预置。

  • Amazon Aurora 全球数据库提供跨多个亚马逊云科技区域的全球低延迟读取和灾难恢复能力。

  • 蓝绿部署在同步的暂存环境中复制生产数据库,从而可在不影响生产环境的情况下进行修改。

  • Amazon EC2 R6gd 和 R6id 实例上的 Amazon Aurora 优化读取功能使用本地存储,来增强复杂查询和索引重新生成操作的读取性能和吞吐量。对于不适合放入内存的向量工作负载,与相同大小的 Amazon Aurora 实例相比,Amazon Aurora 优化读取功能可将查询性能提升高达 9 倍。

  • Amazon Aurora 与 Secrets Manager、IAM 和 Amazon RDS 数据 API 等亚马逊云科技服务无缝集成,确保能够安全地从 Amazon Bedrock 连接到数据库,并支持使用 SQL 进行向量操作。

要详细了解如何为知识库配置 Amazon Aurora,请扫码参阅相关亚马逊云科技数据库博客文章和 Amazon Aurora 用户指南。

Pinecone 无服务器 – Pinecone 最近推出了 Pinecone 无服务器。如果您在知识库中选择将 Pinecone 作为自定义向量存储,则提供 Pinecone 或 Pinecone 无服务器配置的详细信息均可。这两个选项都受支持。

55c104461ca466b3237bafa61cc60e31.png

pgvector 

扫码了解更多

73ec2d61ecea7a7f8b5d7963c0746bf3.png

Aurora Serverless v2

扫码了解更多

cedcf9a5be771678c917d282897696ba.png

Aurora 全球数据库

扫码了解更多

ec6110a1bd386ec2c136dac173e1499d.png

蓝绿部署

扫码了解更多

491175f42719e3041180e8a638cac915.png

Amazon EC2 R6gd

扫码了解更多

0523b6a124ef4b56b80b69892d21999d.png

Amazon EC2 R6id

扫码了解更多

c228edabf49ceea5d272fb04c9e55c7a.png

亚马逊云科技数据库博客文章

扫码了解更多

cc6b18ca4384cdbc0e0c8569c6165af7.png

Aurora 优化读取

扫码了解更多

064f7dbf584134b4140598c055828e33.png

Aurora 用户指南

扫码了解更多

左右滑动查看更多

降低 Amazon OpenSearch 无服务器

中的开发和测试工作负载成本

当您选择此选项来快速创建新的向量存储时,Amazon Bedrock 会在您账户的 Amazon OpenSearch 无服务器中创建一个向量索引,因此无需自行管理任何内容。

自 11 月上线以来,Amazon OpenSearch 无服务器的向量引擎让您可以选择为开发和测试工作负载禁用冗余副本,从而降低成本。您最初可以使用两个 OpenSearch 计算单元 (OCU),一个用于索引,另一个用于搜索,与使用冗余副本相比,这样操作的成本可减少一半。此外,OCU 支持小数计费,可首先使用 0.5 个 OCU,然后根据需要扩展,从而可以进一步降低成本。对于开发和测试工作负载,最低 1 个 OCU(在索引和搜索负载之间拆分)现在就足够了,与生产工作负载需要的 4 个 OCU 相比,成本可降低高达 75%。

易用性改进 – 现在,当您在 Amazon Bedrock 知识库中选择快速创建工作流时,系统会默认禁用冗余副本。您也可以通过选择更新到生产工作负载来创建具有冗余副本的集合。

1f522c589b124836bfe14b6c0c28bb1b.png

有关 Amazon OpenSearch 无服务器的向量引擎的更多详情,请扫码参阅相关文章。

e4a804ad15a6af912b94d99384814584.png

相关文章

扫码了解更多

更多 FM 选择

在运行时,RAG 工作流会从用户查询开始。使用嵌入模型,可以创建输入提示的向量嵌入表示。然后使用此嵌入在数据库中查询相似的向量嵌入,以检索最相关的文本作为查询结果。接下来,将查询结果添加到原始提示中,并将增强的提示传递给 FM。模型使用提示中的附加上下文来生成完成内容,如下图所示:

9e720aac13242b737d095ea318fe7949.png

outside_default.png

了解详情

6ce519c3c8a82edcb99ba5ceaf290e24.png

Amazon Bedrock 

知识库产品页面

扫码了解更多

1ddaba0ef474cb960173a3b6201ac396.png

社区上的

 Amazon Bedrock 知识库

扫码了解更多

左右滑动查看更多

outside_default.png

阅读有关 Amazon Bedrock 知识库的更多信息

48373c6b4cc68d45d0ba4e93ad2a048a.png

博客文章 1

扫码了解更多

55fb09511a6d5d95e317e263506b4326.png

博客文章 2

扫码了解更多

左右滑动查看更多

72db2f28a0af701639501a68e93b6200.png

ae916715123655765d63f7de4684b4e0.gif

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

3263b3ec40f4547aec4144dd485dca7e.gif

点击阅读原文查看博客,获得更详细内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值