re:Invent 2023 | 生成式 AI:深度架构和应用程序

关键字: [Amazon Web Services re:Invent 2023, Amazon Bedrock, Generative Ai Architectures, Large Language Models, Retrieval Augmented Generation, Agents, Security And Compliance]

本文字数: 1600, 阅读完需: 8 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV14u4y1g7Qp

导读

在快节奏的 AI 世界中,先进的生成式 AI 概念至关重要。为了保持竞争力和创新性,企业必须努力理解和实施复杂的方法。但由于这些讨论的初级阶段,明确和全面的资源可能很稀少,造成有效利用的困难。本论坛通过深入探讨这些新兴概念,解决这个问题。通过讨论实际应用并详细介绍实现最佳实践,本论坛提供了一个具体的理解,使企业能够在生成式 AI 中有效地使用这些前沿发展。

演讲精华

以下是小编为您整理的本次演讲的精华,共1300字,阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

亚马逊云科技在2022年拉斯维加斯举行的re:Invent上举办了一场关于生成性AI的讨论。今年,共有500多名热情观众涌向充满活力的礼堂,期待着了解这一新兴技术的发展。作为亚马逊云科技的开发者倡导者,Mike Chambers和Tiffany Fong专门研究人工智能,他们对众多与会者在繁忙的re:Invent日程中抽出时间参加他们在广阔校园里的1小时讲座表示感激。

Mike指出,今年是会议上唯一一场专门讨论生成性AI的会议。考虑到近年来关于生成性AI的巨大关注和兴趣,他对这么多人在繁忙的re:Invent日程中抽出时间参加他们的讲座表示感谢。

在舞台背景灯光明亮的背景下,Mike开始了互动式的观众调查问题:“您今天在工作负载或工作流中是否使用了生成性AI?”随着实时结果的出炉,Tiffany注意到有超过50%的人已经在他们的工作中使用了像ChatGPT这样的工具,用于生成代码片段或总结长文档等用途。Mike分享说,他本人定期使用生成性AI来创建演示文稿,发现它在制作内容方面非常有用。

在设定好观众对生成性AI的熟悉程度后,Mike简要回顾了一下它的定义以及它独特的地方。简单来说,生成性AI是根据收到的提示生成全新的内容,而不仅仅是预测现有数据。如今,大多数生成性AI应用的基础是大型语言模型(LLM)。Mike解释了LLM是如何工作的——它们在大量的文本数据(通常是TB级别的数据)上进行训练,需要大量的计算资源。2017年的变革性的突破是变换器架构,使模型能够从数百万扩展到数十亿、甚至万亿的参数,这解锁了新的涌现能力。过去的AI模型仅限于单一任务,如翻译或摘要,而LLM可以通用,能够执行各种自然语言任务,如回答问题、生成代码或创建摘要。

Tifani指出,现有的语言模型(LLM)存在一定的局限性。由于它们在广泛的公共数据集上进行预训练,因此缺乏针对特定业务或领域的专有知识。它们的知识在训练过程中被固定,这可能导致在不谨慎设计提示的情况下产生误解或不准确的回应。

为了克服这些限制,Mike深入研究了一种名为检索增强生成技术(RAG)的方法。RAG的核心思想是给LLM提供来自企业数据库或文档的相关数据,以扩展其输入,从而降低误解风险并提高准确性。这种方式并不依赖于LLM的预训练知识,而是利用外部数据源提供相关的事实以纳入输入中。尽管对LLM模型本身进行微调是另一种定制化方法,但与RAG相比,这需要更多的时间和数据。

为了让这些概念更易于理解,Tifani用一个比喻来形容RAG:RAG就像给一个学习巫术的学生提供魔法书一样。LLM是带着广泛的知识离开魔法学校的毕业生。然而,要应对像打败巨魔这样的新挑战,学生需要参考包含21个特定咒语的魔法书。在RAG中,LLM是学生,而像公司数据库这样的数据源扮演着魔法书的角色。

Mike随后通过Python进行了实际代码演示,展示了RAG的应用。他首先将21个示例文本咒语通过一个句子嵌入模型转换为1000维的数值数组,这个数值表示被编码成一个简单的内存向量数据库。接下来,Mike将一个问题嵌入到相同的向量空间中。通过查询索引找到最相似的4个向量,系统从数据库中检索出最相关的文本片段。最后,将这些检索到的文本并入提供给名为Claude的这个LLM的输入中。经过这种增强的输入后,Claude能够生成一个量身定制的准确回应。

Tifani强调了这种方法与无法访问外部数据的标准LLM的不同之处。Mike还澄清说,向量化过程与LLM内部发生的事情是分开的。虽然外部数据要经过一个嵌入模型进行有效的相似性搜索,但检索到的文本作为原始文本被注入回输入中,供LLM处理。

麦克介绍了代理的概念,这些代理本质上提供了API,使长短时记忆(LLM)不仅能够生成文本回应,还能采取行动。作为一个简单的例子,一个代理可以调用一个API来获取当前时间,而不是让LLM猜测时间。更先进的例子包括能够搜索零售网站并代表用户完成购买的代理。

提法尼通过一个完整的架构展示了所有组件是如何组合在一起的。用户的查询被发送到代理,代理会询问LLM是否需要更多数据来形成回应。如果需要,代理会从向量数据库中检索相关信息,用这些数据扩充提示,然后将增强的提示馈送给LLM以生成准确的回应。

麦克展示了亚马逊Bedrock如何在幕后无缝处理这些组件。控制台允许根据使用场景需求选择专门的基础模型,如多语言Jurassic、通用文本模型Claude或图像生成模型Stable Diffusion。数据源被摄入知识库中,自动处理向量化以便于高效检索。预构建的代理提供超过50个常见任务的API,例如与日历或云存储交互。

在重点转移到安全性、审计和合规性等重要主题时,麦克幽默地戴上了一个笔袋和保护领带。他强调了了解生成AI系统不同组件(应用程序、数据源和LLM)之间流动的数据的确切内容的重要性。敏感数据可能暴露给LLM以允许其构造合适的查询。像任何其他接触敏感数据的组件一样,LLM周围的适当记录、治理和合规控制是必不可少的。

提法尼概述了在高度监管的行业(如医疗保健和金融)中帮助满足这些要求的内置选项。S3和CloudWatch对LLM调用的日志记录提供了可能需要用于合规性的详细审计轨迹。PrivateLink支持私有连接,使得数据不会穿越公共互联网,这对于受监管的工作负载至关重要。

在未来,Tiffany表示,随着生成性人工智能(AI)的不断发展,针对准确性和安全性方面的定制化将成为业界关注的焦点。Mike也认同这一点,他认为实验阶段的应用正在逐步转向实际生产环境。他预测,未来的模型将变得更加复杂,甚至会出现诸如视频和音频生成等新的应用领域。最令他兴奋的是,Mike认为生成性AI将通过经济高效地提取数据洞察,从而实现以往因技术复杂性而无法完成的项目。

在总结中,Mike和Tiffany共同呈现了一场深入浅出、引人入胜的演讲,探讨了生成性AI的巨大潜力和负责任开发的重要性。一个小时的讲座通过流畅的概念整合、实时代码演示以及生动的案例讨论,成功地达到了其目标——深入介绍这一革命性技术的架构和应用。与会者们带着更加丰富的知识离开了会场,以便能够更好地推动生成性AI的合理应用并为实现美好未来做好准备。

下面是一些演讲现场的精彩瞬间:

领导者强调,生成式人工智能能够通过生成图像和文字等内容,展示出重要的技术进步。

他们指出,为了应对复杂问题和关注新兴领域,拥有适当的数据和工具至关重要。

领导者还探讨了如何将文本数据转化为嵌入空间,以便用于机器学习和深度学习。

演讲者展示了如何通过Amazon Bedrock标准SDK界面调用AI模型,例如进行文本嵌入。

这个应用利用亚马逊云科技的服务来理解自然语言请求、查询数据源以及向用户提供自然语言回应。

亚马逊云科技提供了预先训练好的机器学习模型,使得从数据中提取价值变得简单且经济实惠。

总结

生成性人工智能作为一项快速发展的技术,具有巨大的潜力。在这次深入剖析的演讲中,全面概述了其从基本概念到前沿应用的发展历程。

演讲者首先阐述了大型语言模型如何成为生成性人工智能的核心。通过对大量数据集进行预训练,这些模型具备了诸如生成图像和文字,以及回答自然语言问题等各种能力。然而,它们的知识仍受限于训练数据。

为了克服这些限制,研究人员采用了检索辅助生成和对话代理的方法。通过这些方法,它们可以为提示提供上下文,减少幻觉并准确地回答问题。演讲者还展示了用于操作向量数据库和提示的代码示例。类似亚马逊Bedrock的全托管服务自动化了整个流程。

随着能力的提高,责任也随之增加。演讲者强调了在监管范围内保护生成性模型的重要性。日志记录、审计和专用端点有助于满足合规需求。

展望未来,定制解决方案的使用将成为关键。这将使以前无法实现的项目得以实现,预示着一个充满希望的生成性人工智能的未来。然而,随着能力的增长,负责任的管理仍将至关重要。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134828396

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

  • 24
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值