利用RAG和亚马逊云科技向量数据库,打造差异化的生成式AI应用

关键字: [亚马逊云科技中国峰会2024, Bedrock Knowledge Base, 生成式Ai应用, 专用数据集成, 向量数据库选型, 语义相关上下文, 提示词工程]

本文字数: 2300, 阅读完需: 12 分钟

导读

在亚马逊云科技中国峰会2024上,马丽丽和张浩民分享了如何利用RAG(检索增强生成)和向量数据库打造差异化的生成式AI应用。他们解释了为什么需要使用专有数据来创建独特的生成式AI应用,以及如何通过提示词工程、微调或构建独特模型将专有数据与大模型结合。他们还介绍了如何选择合适的向量数据库,以及亚马逊提供的多种向量数据库服务。最后,张浩民分享了博西家电在工业生产中利用生成式AI解决方法论推广和执行的案例。

演讲精华

以下是小编为您整理的本次演讲的精华,共2000字,阅读时间大约是10分钟。

在当今时代,生成式人工智能(AI)已经获得了广泛的应用,无论是角色扮演、代码辅助、翻译还是分析等领域。大模型的存在是生成式AI应用程序普及的关键驱动力。然而,仅仅调用大模型的接口很难体现企业的独特竞争优势。相反,将企业自身的数据资产与大模型相结合,可以打造出差异化的生成式AI应用程序,从而展现企业的独特魅力。

为了实现这一目标,有几种不同的方式可供选择。首先,提示词工程是最简单快捷的方法,即在用户输入的基础上添加额外的信息,然后将这些信息与用户输入一并提供给大模型,以获得更加个性化和准确的输出结果。其次,微调也是一种可行的方式,即在大模型的基础上,针对企业的私有数据进行微调,从而生成更加针对性的结果。第三种方式是构建独立的模型,专门用于解决企业的特定问题。

为了说明利用专用数据打造差异化生成式AI应用程序的重要性和可行性,我们可以借助一个具体的案例进行说明。假设我们是一家汽车保险销售公司,如果用户询问购买车险,最简单的做法是将用户的请求直接发送给大模型。在这种情况下,大模型可能会列举出各种不同类型的车险,如交强险等,并根据用户的车辆信息和历史购买记录提供一些建议。然而,用户仍需要根据自身的实际情况,对号入座,判断自己属于哪一种情况,然后做出选择。

相比之下,如果我们能够将用户的个人信息(如地址、车辆信息、历史购买记录等)以及公司的车险政策相关内容一并提供给大模型,就能获得更加个性化和准确的推荐结果。例如,系统可以先向用户确认”您好,XXX,我已经查到您的地址是XXX,您的车辆信息是XXX,您历史购买的车险信息是XXX,请您确认这些信息是否正确”。然后根据这些信息,为用户推荐合适的报价类型。这种方式不仅能够提高推荐的准确性,也能够体现出我们企业独特的魅力所在。

为了实现上述目标,我们需要利用一种称为RAG(检索增强生成)的技术。RAG的流程包括两个主要部分:数据准备和数据查证。在数据准备阶段,我们需要将相关的知识文档进行分片处理,然后使用向量模型将每个分片转换为embedding(嵌入)的形式,也就是向量表示,并将这些向量存储在向量库中。在数据查证阶段,我们将用户的输入也转换为向量表示,然后在向量库中查找与之最相似的向量,从而获取与用户输入最相关的信息。

在这个过程中,向量embedding的概念起到了关键作用。向量embedding实际上是一种将文本转化为向量表示的方法,相似的向量代表着语义上的相关性更高。具体来说,向量可以被视为一个数组,数组中的每个元素都是一个数字。一条向量就对应着向量空间中的一个点,计算两个向量之间的距离实际上就是计算这两个点之间的距离。如果两个向量的距离更加接近,那么它们所代表的文本信息就更加具有语义相关性。

在选择向量数据库时,我们需要考虑以下几个方面:首先是熟悉程度,如果我们已经熟悉某种数据库系统及其接口,那么使用该系统提供的向量处理能力将会更加省事。其次是简单快捷性,即该向量数据库是否与当前流行的框架(如LangChain、LlamaIndex、Bedrock等)有良好的集成,能够帮助我们快速实现所需功能。第三个考虑因素是可扩展性,包括支持的向量维度、能够处理的数据量等。例如,亚马逊云科技的PGVector 0.7版本提供了一个新功能,即能够计算不同维度向量之间的相似度,这对于处理不断扩展的embedding模型非常有用。第四是性能,如吞吐量、并发能力、召回率等。最后是灵活性,即该向量数据库是否支持处理其他类型的数据,以满足我们的特定需求。

亚马逊云科技(亚马逊云科技)在多个服务中都提供了向量数据处理的能力,以满足不同客户的需求。例如,OpenSearch可以将传统的倒排索引查询与向量查询相结合,为用户提供更加全面的结果。AuroraRDS PostgreSQL则支持关联查询,用户可以在向量数据中挑选出特定的向量,然后进行进一步的关联查询。MemoryDB是一种内存数据库,支持缓存功能,用户可以将大模型返回的结果进行缓存,以加快响应速度。DocumentDB提供了MongoDB兼容的接口,适用于处理文档数据并构建个性化的生成式AI应用程序。最后,Neptune是一种图数据库,能够在几秒钟内对大量图数据进行分析,并提供向量处理能力,适用于需要获取精确关联信息的场景,如医疗医药或研究领域。

为了进一步说明RAG和向量数据库在实际应用中的作用,我们可以借助一个来自博西家电的客户案例。博西家电是一家全球化的制造自有品牌家电及销售家电的企业,在中国区域拥有博世、西门子和加格娜三个品牌,共有七家自营工厂,生产六个品类的家电

在博西家电的七家工厂中,由于生产的家电品类不同,各自采用了不同的生产框架、质量管理体系和方法论,如8D、PDCA、KK、飞马等。这些方法论之间存在着巨大差异。在解决问题时,每一种方法论都会链接到大量的数据,包括结构化数据(如缺陷记录和维护记录)和非结构化数据(如操作指导、测试文档、自然语言文本、图片或声音文件等)。对于人类来说,在短时间内理解和总结这些数据是一个巨大的挑战。

此外,时效性也是方法论执行过程中的一个重要问题。以QRQC(快速质量应对性方法论)为例,当生产线上连续出现几个产品的质量偏差时,就需要立即停止生产,启动QRQC方法论进行快速解决。虽然QRQC包含了短期和长期解决方案,但在纸质看板时代,关闭一个QRQC方法论平均需要3个月以上的时间,即使在电子化之后,平均时间也需要两个月左右,这对于一个”快速”的方法论来说是不可接受的。

最后,方法论的推广也是一个重要的挑战。虽然专家对方法论和相关数据有深入的了解,但在实际使用过程中,工程师和一线的蓝领操作员工往往是最多的使用者,人数可能高达数百人。他们对方法论的理解和执行存在一定的困难,这严重影响了方法论的推广和执行质量。实际上,在系统上线前一个月,就有一位来自某工厂的方法论专家诉苦说,每天都被打爆电话,询问下一步该如何执行方法论、如何填写相关文档等。

生成式AI在解决上述问题方面具有独特的优势。首先,生成式AI对于各种方法论有着专家级别的理解,它所阅读的相关论文和文档甚至比人类专家还要多。其次,生成式AI能够综合处理各种类型的数据,包括结构化和非结构化数据,并给出相应的反馈。例如,对于一个工单,生成式AI可以实时催促、帮助填写,或者监控相关流程。最后,生成式AI擅长与人进行自然语言交流,可以用自然语言的方式引导一线员工执行特定的方法论。

为了说明生成式AI在实际应用中的作用,我们可以借助博西家电的一个具体案例。假设某台机器需要进行重点维护检查,系统会根据预设的方法论逻辑,指导蓝领员工逐步执行检查流程。

首先,系统会要求蓝领员工检查机器运行的第一个规定动作,即机械臂抓取工装上的零件,并将其移动到特定位置。在这个动作中,需要检查多个位置,如工装本身是否存在偏差或公差,从而影响机械臂的抓取精度。如果工装满足条件1、条件2和条件3,则意味着工装没有问题,但仍需要进行自主性维护,以确保未来生产的顺利进行。

如果工装不满足条件1、条件2和条件3,则可能出现现象1、现象2、现象3或现象4。在这种情况下,系统会引导蓝领员工进行缺陷记录、问题跟踪,并提供相应的操作指导,以帮助机器复原到最初状态。例如,如果出现现象1,就需要进行缺陷记录、问题跟踪,并可能有操作指导让机器复原。

在没有生成式AI系统的情况下,蓝领员工需要查阅大量的纸质报表和操作指导,或者使用iPad到处查找相关文档,效率极低。有了生成式AI系统,蓝领员工只需要简单地询问系统”某机器需要做重点的维护检查,请协助一下”,就能获得根据预设方法论的逻辑指导,大大提高了效率和方法论的执行质量。

总的来说,通过将企业数据与大模型相结合,特别是利用RAG和向量数据库处理语义相关内容,可以打造出差异化且契合企业需求的生成式AI应用程序,为企业带来独特的竞争优势。生成式AI不仅对各种方法论有深入的理解,还能综合处理多种数据,并用自然语言指导一线员工执行,从而提高了方法论的执行效率和质量,解决了传统方式面临的诸多挑战。

下面是一些演讲现场的精彩瞬间:

马丽丽和张浩民共同探讨了如何利用RAG和向量数据库打造差异化的生成式AI应用。

6a3e108f87668e10eb4d6e008e8aeb7a.jpeg

亚马逊云科技中国峰会2024上,演讲者举例说明了如何利用大模型为用户提供个性化的车险购买建议,展示了云技术在保险销售等行业的应用前景。

1c5ee1bda54f86ff944162f6a71f775f.jpeg

亚马逊云科技中国峰会2024:探讨如何利用现成框架和工具,如LangChain、LlamaIndex和Bedrock Knowledge Base,简化和加速生成式AI的实现。

5cebdc16f3c99bb12b6a2084c79e4d05.jpeg

博西两个字代表着博世和西门子两大家电品牌,是一家全球化制造自有品牌家电及销售家电的企业。

b03a7cf6983254fc78c412dcf7b68779.jpeg

在亚马逊云科技中国峰会2024上,演讲者强调了QRQC(快速质量应对性方法论)的重要性,指出在电子化后,关闭一个QRQC方法论的时间缩短至平均两个月左右,体现了时效性的重要性。

81619a99d0a4f8645e092ef4f7c0c988.jpeg

生成式AI助力方法论推广,帮助一线蓝领员工快速理解和使用复杂的方法论

亚马逊云科技中国峰会2024演讲者阐述了工装故障排查的流程,包括现象识别、缺陷记录、问题跟踪和操作指导等环节。

66aa9e0b363e5c4e8796c57a120bf7d3.jpeg

总结

生成式AI已经广泛应用于各个领域,但要打造差异化的生成式AI应用,需要利用企业自身的专有数据与大模型相结合。通过提示词工程、微调或构建独特模型等方式,将企业数据与大模型输入相结合,可以生成更加个性化和准确的输出。其中,提示词工程是最简单快捷的方式,将相关数据作为提示词与用户输入一并发送给大模型。

利用检索增强生成(RAG)架构和向量数据库,可以高效地将语义相关的专有数据融入生成式AI应用。向量数据库通过将文本转换为向量表示,能够快速查找语义上相似的内容。在选择向量数据库时,需要考虑熟悉程度、实现简单性、可扩展性、性能和灵活性等因素。亚马逊云科技提供了多种服务支持向量数据处理,如OpenSearch、Aurora PostgreSQL、MemoryDB、DocumentDB和Neptune等,可根据具体需求进行选择。

博西家电通过生成式AI构建了一个智能问题解决系统(AIPSS),应用于工厂的质量管理和设备维护等领域。该系统能够理解各种质量管理方法论,整合结构化和非结构化数据,并通过自然语言与现场工人交互,高效指导执行相关流程,解决了传统方式中专家指导力量有限、流程执行效率低下等痛点。

2024年5月29日,亚马逊云科技中国峰会在上海召开。峰会期间,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松全面阐述了亚马逊云科技如何利用在算力、模型、以及应用层面丰富的产品和服务,成为企业构建和应用生成式 AI 的首选。此外,活动还详细介绍了亚马逊云科技秉承客户至尚的原则,通过与本地合作伙伴一起支持行业客户数字化转型和创新,提供安全、稳定、可信赖的服务,以及持续深耕本地、链接全球,助力客户在中国和全球化发展的道路上取得成功。

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值