re:Invent 2023 | 生成式 AI：深度架构和应用程序-CSDN博客

本文链接：https://blog.csdn.net/weixin_46812959/article/details/134828404

关键字: [Amazon Web Services re:Invent 2023, Amazon Bedrock, Generative Ai Architectures, Large Language Models, Retrieval Augmented Generation, Agents, Security And Compliance]

本文字数: 1600, 阅读完需: 8 分钟

视频

如视频不能正常播放，请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV14u4y1g7Qp

导读

在快节奏的 AI 世界中，先进的生成式 AI 概念至关重要。为了保持竞争力和创新性，企业必须努力理解和实施复杂的方法。但由于这些讨论的初级阶段，明确和全面的资源可能很稀少，造成有效利用的困难。本论坛通过深入探讨这些新兴概念，解决这个问题。通过讨论实际应用并详细介绍实现最佳实践，本论坛提供了一个具体的理解，使企业能够在生成式 AI 中有效地使用这些前沿发展。

演讲精华

以下是小编为您整理的本次演讲的精华，共1300字，阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文，请观看演讲完整视频或者下面的演讲原文。

亚马逊云科技在2022年拉斯维加斯举行的re:Invent上举办了一场关于生成性AI的讨论。今年，共有500多名热情观众涌向充满活力的礼堂，期待着了解这一新兴技术的发展。作为亚马逊云科技的开发者倡导者，Mike Chambers和Tiffany Fong专门研究人工智能，他们对众多与会者在繁忙的re:Invent日程中抽出时间参加他们在广阔校园里的1小时讲座表示感激。

Mike指出，今年是会议上唯一一场专门讨论生成性AI的会议。考虑到近年来关于生成性AI的巨大关注和兴趣，他对这么多人在繁忙的re:Invent日程中抽出时间参加他们的讲座表示感谢。

在舞台背景灯光明亮的背景下，Mike开始了互动式的观众调查问题：“您今天在工作负载或工作流中是否使用了生成性AI？”随着实时结果的出炉，Tiffany注意到有超过50%的人已经在他们的工作中使用了像ChatGPT这样的工具，用于生成代码片段或总结长文档等用途。Mike分享说，他本人定期使用生成性AI来创建演示文稿，发现它在制作内容方面非常有用。

在设定好观众对生成性AI的熟悉程度后，Mike简要回顾了一下它的定义以及它独特的地方。简单来说，生成性AI是根据收到的提示生成全新的内容，而不仅仅是预测现有数据。如今，大多数生成性AI应用的基础是大型语言模型（LLM）。Mike解释了LLM是如何工作的——它们在大量的文本数据（通常是TB级别的数据）上进行训练，需要大量的计算资源。2017年的变革性的突破是变换器架构，使模型能够从数百万扩展到数十亿、甚至万亿的参数，这解锁了新的涌现能力。过去的AI模型仅限于单一任务，如翻译或摘要，而LLM可以通用，能够执行各种自然语言任务，如回答问题、生成代码或创建摘要。

Tifani指出，现有的语言模型（LLM）存在一定的局限性。由于它们在广泛的公共数据集上进行预训练，因此缺乏针对特定业务或领域的专有知识。它们的知识在训练过程中被固定，这可能导致在不谨慎设计提示的情况下产生误解或不准确的回应。

为了克服这些限制，Mike深入研究了一种名为检索增强生成技术（RAG）的方法。RAG的核心思想是给LLM提供来自企业数据库或文档的相关数据，以扩展其输入，从而降低误解风险并提高准确性。这种方式并不依赖于LLM的预训练知识，而是利用外部数据源提供相关的事实以纳入输入中。尽管对LLM模型本身进行微调是另一种定制化方法，但与RAG相比，这需要更多的时间和数据。

为了让这些概念更易于理解，Tifani用一个比喻来形容RAG：RAG就像给一个学习巫术的学生提供魔法书一样。LLM是带着广泛的知识离开魔法学校的毕业生。然而，要应对像打败巨魔这样的新挑战，学生需要参考包含21个特定咒语的魔法书。在RAG中，LLM是学生，而像公司数据库这样的数据源扮演着魔法书的角色。

Mike随后通过Python进行了实际代码演示，展示了RAG的应用。他首先将21个示例文本咒语通过一个句子嵌入模型转换为1000维的数值数组，这个数值表示被编码成一个简单的内存向量数据库。接下来，Mike将一个问题嵌入到相同的向量空间中。通过查询索引找到最相似的4个向量，系统从数据库中检索出最相关的文本片段。最后，将这些检索到的文本并入提供给名为Claude的这个LLM的输入中。经过这种增强的输入后，Claude能够生成一个量身定制的准确回应。

Tifani强调了这种方法与无法访问外部数据的标准LLM的不同之处。Mike还澄清说，向量化过程与LLM内部发生的事情是分开的。虽然外部数据要经过一个嵌入模型进行有效的相似性搜索，但检索到的文本作为原始文本被注入回输入中，供LLM处理。

麦克介绍了代理的概念，这些代理本质上提供了API，使长短时记忆（LLM）不仅能够生成文本回应，还能采取行动。作为一个简单的例子，一个代理可以调用一个API来获取当前时间，而不是让LLM猜测时间。更先进的例子包括能够搜索零售网站并代表用户完成购买的代理。

提法尼通过一个完整的架构展示了所有组件是如何组合在一起的。用户的查询被发送到代理，代理会询问LLM是否需要更多数据来形成回应。如果需要，代理会从向量数据库中检索相关信息，用这些数据扩充提示，然后将增强的提示馈送给LLM以生成准确的回应。

麦克展示了亚马逊Bedrock如何在幕后无缝处理这些组件。控制台允许根据使用场景需求选择专门的基础模型，如多语言Jurassic、通用文本模型Claude或图像生成模型Stable Diffusion。数据源被摄入知识库中，自动处理向量化以便于高效检索。预构建的代理提供超过50个常见任务的API，例如与日历或云存储交互。

在重点转移到安全性、审计和合规性等重要主题时，麦克幽默地戴上了一个笔袋和保护领带。他强调了了解生成AI系统不同组件（应用程序、数据源和LLM）之间流动的数据的确切内容的重要性。敏感数据可能暴露给LLM以允许其构造合适的查询。像任何其他接触敏感数据的组件一样，LLM周围的适当记录、治理和合规控制是必不可少的。

提法尼概述了在高度监管的行业（如医疗保健和金融）中帮助满足这些要求的内置选项。S3和CloudWatch对LLM调用的日志记录提供了可能需要用于合规性的详细审计轨迹。PrivateLink支持私有连接，使得数据不会穿越公共互联网，这对于受监管的工作负载至关重要。

在未来，Tiffany表示，随着生成性人工智能（AI）的不断发展，针对准确性和安全性方面的定制化将成为业界关注的焦点。Mike也认同这一点，他认为实验阶段的应用正在逐步转向实际生产环境。他预测，未来的模型将变得更加复杂，甚至会出现诸如视频和音频生成等新的应用领域。最令他兴奋的是，Mike认为生成性AI将通过经济高效地提取数据洞察，从而实现以往因技术复杂性而无法完成的项目。

在总结中，Mike和Tiffany共同呈现了一场深入浅出、引人入胜的演讲，探讨了生成性AI的巨大潜力和负责任开发的重要性。一个小时的讲座通过流畅的概念整合、实时代码演示以及生动的案例讨论，成功地达到了其目标——深入介绍这一革命性技术的架构和应用。与会者们带着更加丰富的知识离开了会场，以便能够更好地推动生成性AI的合理应用并为实现美好未来做好准备。

下面是一些演讲现场的精彩瞬间：

领导者强调，生成式人工智能能够通过生成图像和文字等内容，展示出重要的技术进步。

他们指出，为了应对复杂问题和关注新兴领域，拥有适当的数据和工具至关重要。

领导者还探讨了如何将文本数据转化为嵌入空间，以便用于机器学习和深度学习。

演讲者展示了如何通过Amazon Bedrock标准SDK界面调用AI模型，例如进行文本嵌入。

这个应用利用亚马逊云科技的服务来理解自然语言请求、查询数据源以及向用户提供自然语言回应。

亚马逊云科技提供了预先训练好的机器学习模型，使得从数据中提取价值变得简单且经济实惠。

总结

生成性人工智能作为一项快速发展的技术，具有巨大的潜力。在这次深入剖析的演讲中，全面概述了其从基本概念到前沿应用的发展历程。

演讲者首先阐述了大型语言模型如何成为生成性人工智能的核心。通过对大量数据集进行预训练，这些模型具备了诸如生成图像和文字，以及回答自然语言问题等各种能力。然而，它们的知识仍受限于训练数据。

为了克服这些限制，研究人员采用了检索辅助生成和对话代理的方法。通过这些方法，它们可以为提示提供上下文，减少幻觉并准确地回答问题。演讲者还展示了用于操作向量数据库和提示的代码示例。类似亚马逊Bedrock的全托管服务自动化了整个流程。

随着能力的提高，责任也随之增加。演讲者强调了在监管范围内保护生成性模型的重要性。日志记录、审计和专用端点有助于满足合规需求。

展望未来，定制解决方案的使用将成为关键。这将使以前无法实现的项目得以实现，预示着一个充满希望的生成性人工智能的未来。然而，随着能力的增长，负责任的管理仍将至关重要。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134828396

想了解更多精彩完整内容吗？立即访问re:Invent 官网中文网站！

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处，一键获取亚马逊云科技全球最新产品/服务资讯！

点击此处，一键获取亚马逊云科技中国区最新产品/服务资讯！

即刻注册亚马逊云科技账户，开启云端之旅！

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁？

亚马逊云科技（Amazon Web Services）是全球云计算的开创者和引领者，自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务，涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体，以及应用开发、部署与管理等方面；基础设施遍及 31 个地理区域的 99 个可用区，并计划新建 4 个区域和 12 个可用区。全球数百万客户，从初创公司、中小企业，到大型企业和政府机构都信赖亚马逊云科技，通过亚马逊云科技的服务强化其基础设施，提高敏捷性，降低成本，加快创新，提升竞争力，实现业务成长和成功。