使用亚马逊云科技和 MongoDB Atlas 构建生成式 AI 丰富的应用程序

关键字: [Amazon Web Services re:Invent 2023, Atlas Vector Search, Vector Search, Large Language Models, Retrieval Augmented Generation, Dedicated Search Nodes, Semantic Search]

本文字数: 1400, 阅读完需: 7 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1bC4y1c7b4

导读

了解如何使用亚马逊云科技服务和 MongoDB Atlas 构建生成式 AI 驱动的应用程序。为了提供积极的生成式 AI 体验,支持这些应用程序的基础模型 (FM) 需要访问专有、操作和实时数据。MongoDB Atlas 在操作数据库中嵌入了本机向量搜索,使得用专有的多模态数据增强 FM 变得简单——这一过程称为检索增强生成。但生成式 AI 应用程序构建者也需要快速迭代的灵活性,并确保其应用程序可以安全地大规模执行。了解如何使用 Atlas 开发人员数据平台,在为企业做好准备的同时,将生成式 AI 应用程序快速推向市场。本演示文稿由亚马逊云科技合作伙伴 MongoDB 为您带来。

演讲精华

以下是小编为您整理的本次演讲的精华,共1100字,阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

本段文字主要介绍了两位来自MongoDB的产品团队成员Ben和Seth,他们讨论了如何使用MongoDB Atlas Vector Search来构建生成性AI应用的主题。首先,他们对向量以及向量搜索的工作原理进行了背景介绍。向量作为数据及其相关上下文的数值表示,例如,句子可以转换为一个高维向量,捕捉到单词背后的语义和含义。相似数据的向量在高维向量空间中位置相近,这使得可以使用k-最近邻搜索算法找到与目标向量相似的其他向量。然而,这种扫描所有向量的方式并不能很好地扩展,因此需要使用分层可导航小世界图进行近似最近邻搜索。

接下来,Ben和Seth介绍了MongoDB Atlas Vector Search的功能。它允许在MongoDB文档内创建向量字段、对它们进行索引并使用新的$vectorSearch聚合管道阶段进行查询。此阶段具有诸如向量索引、查询向量、要检查的候选数量、结果限制和过滤器等参数。Atlas Vector Search提供了统一的API和查询语言,利用了MongoDB强大的聚合框架。

他们还强调了向量搜索的一些有吸引力的用例,包括语义搜索、问题回答、推荐、同义词生成和多模态搜索。最令人兴奋的是使用向量搜索来实现检索增益生成,即在使用大型语言模型的基础上进行检索。在这里,对私有业务数据的向量搜索提供上下文信息,以便在不直接将敏感数据暴露给模型的情况下聚焦和精炼来自基础LM模型的响应。

为了实现检索增益生成,应用程序框架协调了向量搜索和LM之间的数据传输。MongoDB与各种LM应用程序框架(如Anthropic、Cohere、LangChain等)合作,以支持这些集成。

本段文字主要讨论了MongoDB Atlas如何将向量搜索和交易能力整合到一个统一的平台上。Atlas Search通过提供独立的搜索节点,使得向量搜索能够独立于MongoDB集群进行扩展。这些搜索节点经过了内存优化,并且可以每个集群扩展至32个节点以处理高查询量。

演讲者强调了MongoDB Atlas如何利用向量搜索和交易能力构建一个统一平台。通过改变流自动同步数据并更新索引,减少应用程序的复杂性。独立的搜索节点独特地允许向量搜索独立于MongoDB工作负载进行扩展。

本段还探讨了向量的概念以及如何在向量搜索中使用它们。向量是数据和相关语义上下文的数值表示。例如,句子“快速的棕色狐狸”可以被转换为一个高维向量。词汇本身作为数据,而上下文包括诸如快速代表快的含义、棕色是一种颜色、狐狸是指动物等概念。这种在结构化向量数据中嵌入语义能力非常强大。生成这些向量表示的方法是通过针对特定类型(如文本、音频或视频)的嵌入模型来喂养数据。预训练的通用模型可以将定制的数据嵌入到向量空间中。

这些算法采用类似于可导航小世界图的数据结构,以更快的速度遍历和识别候选邻居,从而在牺牲一定准确性的前提下提高性能。在使用这些算法时,需要指定用于比较向量的距离函数。本文介绍了Atlas Vector Search中可用的三种主要距离函数:欧几里得、余弦和点积相似性。

转向Atlas Vector Search,文章详细讲解了如何在MongoDB文档内创建和索引向量字段。索引定义包含了向量字段、维度数量和相似性函数等信息。在后台,MongoDB会构建一个支持快速近似最近邻查询的向量索引。

通过使用$vectorSearch聚合管道阶段执行查询,用户可以指定诸如索引、查询向量、候选数量、限制条件和过滤器等参数。文章强调了这个阶段如何利用MongoDB功能强大的聚合框架,从而在数据库内部对查询结果进行额外处理。

接着,文章解释了为什么向量搜索现在如此重要,因为先进的机器学习模型已经在向量中嵌入丰富的语义上下文。文章概述了从2010年代的Word2Vec到2018年的BERT,再到现在的GPT-3等模型的发展历程。这些模型引发了许多新的有趣的应用场景。

此外,文章还列举了一些实际的例子和集成方法。应用场景包括语义搜索、问题回答、推荐、同义词生成和多模态搜索等。其中一个最令人兴奋的领域是使用向量搜索通过一种称为检索增强生成的策略为大型语言模型提供聚焦的背景。在这个策略中,对私有数据的向量搜索提供了有关背景信息,以改进并提高LM生成的文本,而无需将私有数据直接提供给模型本身。

为了实现这些集成,MongoDB与各种语言模型应用框架(如Anthropic、Cohere、LangChain等)合作。这些框架负责协调向量搜索和LM之间的数据传输。文章重申了向量搜索通过允许应用程序用私有、专有数据扩充基础LM模型,从而解锁持久的差异化。

下面是一些演讲现场的精彩瞬间:

领导者探讨了Atlas向量搜索以及该平台上的全新搜索笔记功能。

在高维向量空间中,诸如"男人"和"女人"这样的语义相近词汇的向量位置彼此非常接近。

向量之间的关联性会因嵌入数据的方式及所使用的距离函数而变化。

不同的嵌入模型和距离函数可能产生对向量间相似性的不同理解。

领导者解释了如何运用向量搜索和k近邻算法来寻找类似的数据。

领导者详细描述了近似k近邻搜索如何通过牺牲一定准确性来实现巨大性能提升,从而提供实时的用户体验。

领导者提到了美元向量搜索中最有趣的功能是numb_candidates和limit,它们允许您在性能与准确性之间进行权衡。

总结

向量搜索作为一种令人激动的新技术,能够对非结构化数据执行语义搜索,并将其转换为数值向量。这些向量能够捕捉意义和上下文,使得相似的向量在向量空间中聚类在一起。如今,生成性人工智能模型已经能够创造出极具表现力的向量,从而实现诸如语义搜索和检索增强等功能。

MongoDB Atlas将向量搜索与MongoDB的文档模型完美地融合在一个完全管理的云数据库中。通过统一的API和查询语言,应用程序开发得到了极大的简化。与AI框架(如Anthropic、Cohere和LangChain)的合作也为尖端的人工智能应用提供了支持。

然而,扩展向量搜索工作负载在计算和内存方面仍面临挑战。为了解决这个问题,MongoDB Atlas引入了专用的搜索节点,以便独立地扩展向量搜索操作工作负载。搜索节点将向量索引完全保存在内存中以提升速度,同时优化成本。这种架构使得在使用MongoDB的情况下,应用程序开发变得轻松,上市时间更快,且扩展更加高效。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134819729

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

  • 21
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李白的朋友高适

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值