RAG与Fine Tuning:如何选择正确的方法

前言

生成式人工智能有潜力改变你的业务和数据工程团队,但前提是要正确实施。那么,你的数据团队如何才能真正利用大型语言模型或生成式人工智能_(GenAI)_计划来驱动价值呢?

领先的组织通常在两种新兴框架之间做出选择,这些框架区分了其业务价值的人工智能:RAG与Fine Tuning。

什么是检索增强生成_(RAG)_与Fine Tuning之间的区别?你的组织应该什么时候选择RAG还是Fine Tuning?应该同时使用吗?

我们将深入探讨RAG与Fine Tuning的基础知识,了解每种方法的最佳用途,它们的优点以及一些实际应用案例来帮助你入门。

目录

  • 什么是检索增强生成_(RAG)_?

  • 什么是Fine Tuning?

  • 什么时候使用检索增强生成_(RAG)_?

  • 检索增强生成使用案例

  • 什么时候使用Fine Tuning?

  • Fine Tuning使用案例

  • 如何在RAG与Fine Tuning之间做出选择

常见问题解答

  • RAG比Fine Tuning好吗?

  • RAG与Fine Tuning和提示工程有什么区别?

  • RAG和Fine Tuning可以一起使用吗?

  • RAG比Fine Tuning便宜吗?

  • RAG与模型Fine Tuning有什么区别?

什么是检索增强生成(RAG)?

检索增强生成(RAG)是Meta于2020年推出的一种架构框架,将你的大型语言模型(LLM)连接到一个精选的、动态的数据库。这通过允许LLM访问和结合最新的、可靠的信息来改进其输出和推理能力。

RAG开发是一个复杂的过程,并非凭空而来。它可以涉及提示工程、像Pinecone这样的向量数据库、嵌入向量和语义层、数据建模、数据编排和数据管道——所有这些都为RAG量身定制。

以下是RAG流程的工作方式:

  • **查询处理:**当用户向系统提交查询时,流程开始。这是RAG链检索机制的起点。

  • **数据检索:**根据查询,RAG系统搜索数据库以找到相关数据。这一步涉及复杂的算法,将查询与数据库中最适当和上下文相关的信息进行匹配。

  • **与LLM集成:**一旦检索到相关数据,它就会与用户的初始查询相结合并输入LLM。

  • **响应生成:**利用LLM的能力和检索数据提供的上下文,系统生成一个不仅准确而且针对查询特定上下文的响应。

Databricks中的RAG流程

因此,开发RAG架构对你的数据团队来说是一个复杂的任务,需要开发数据管道来提供增强LLM的专有上下文数据。但是,如果做得正确,RAG可以为AI驱动的数据产品增加巨大的价值。

什么是Fine Tuning?

Fine Tuning是一种生成式人工智能开发的另一种,涉及在较小的、专门的、有标签的数据集上训练LLM,并根据新数据调整模型的参数和嵌入。

在企业级AI的背景下,RAG和Fine Tuning的最终目标是相同的:从AI模型中驱动更大的商业价值。但与其通过访问专有数据库来增强现有LLM,不如通过为特定领域定制模型本身来进行更深入的Fine Tuning。

Fine Tuning涉及在较小的、专门的、有标签的数据集上训练LLM,并根据新数据调整模型的参数和嵌入。通过使模型与特定领域的细微差别和术语对齐,Fine Tuning帮助模型在特定任务中表现得更好。

什么时候使用检索增强生成(RAG)?

对于大多数企业用例,RAG比Fine Tuning更适合,因为它更安全、更可扩展且更可靠。

RAG允许增强的安全性和数据隐私

使用RAG,你的专有数据保留在安全的数据库环境中,允许严格的访问控制;而Fine Tuning中,数据成为模型训练集的一部分,可能会在没有相应可见性的情况下暴露给更广泛的访问。

RAG具有成本效益和可扩展性

Fine Tuning大型AI模型资源密集,需耗费大量时间和计算能力。通过将第一方数据整合到响应中而不是模型参数中,RAG能够在计算级别限制资源成本,并消除训练阶段,以及通过避免花费数周或数月时间制作和标记训练集而在人力级别上节省成本。

RAG提供可靠的结果

AI的价值在于其提供准确响应的能力。RAG在这方面表现出色,因为它不断从最新的精选数据集中提取信息来指导其输出。而且,如果出现问题,数据团队可以更轻松地追踪响应的来源,从而更清楚地了解输出是如何形成的,以及数据出错的地方。

检索增强生成使用案例

2024年初,Apache Airflow和Superset的创建者、Preset的创始人兼首席执行官Maxime Beauchemin告诉我们他的团队如何使用RAG为Preset的BI工具带来AI驱动的功能。

最初,Max和他的团队探索使用OpenAI的API来实现AI驱动的功能,例如客户使用普通语言文本生成SQL查询。但是,鉴于ChatGPT上下文窗口的限制,无法向AI提供关于其数据集的所有必要信息_(例如表格、命名约定、列名和数据类型)_。而当他们尝试Fine Tuning模型和自定义训练时,发现基础设施尚未完全就绪,特别是当他们还需要为每个客户进行细分时。

Max表示:“我迫不及待地想要拥有能够使用你组织的私人信息、GitHub、Wiki、dbt项目、Airflow DAG、数据库架构进行自定义训练或Fine Tuning的基础设施。但我们与许多其他创始人和在这个问题上工作的人进行了交谈,我很清楚在这个时代自定义训练和Fine Tuning真的很困难。”

鉴于Max和他的团队无法将客户的整个数据库甚至只是元数据放入上下文窗口中,“我们意识到我们需要非常聪明的使用RAG,即检索正确的信息以生成正确的SQL。目前,这一切都关乎为正确的问题检索正确的信息,”他说。

什么时候使用Fine Tuning?

根据可用资源,一些组织可能会选择Fine Tuning作为从其生成式AI计划中驱动价值的替代方案。

通过使模型与特定领域的细微差别和术语对齐,Fine Tuning帮助模型在特定任务中表现得更好。它在领域特定的情况下非常有效,比如以特定语气或风格回应详细的提示,例如法律简报或客户支持票据。它也是克服信息偏差和其他限制_(如语言重复或不一致)_的绝佳选择。

与RAG一样,Fine Tuning需要建立有效的数据管道,首先将专有数据提供给Fine Tuning过程。

Fine Tuning使用案例

过去一年的几项研究表明,Fine Tuning模型显著优于现成的GPT-3和其他公开可用的模型。

已经确定,对于许多用例,Fine Tuning的小模型可以优于大型通用模型——在某些情况下,使Fine Tuning成为一种可行的成本效益路径。

例如,Snorkel AI创建了一个数据中心基础模型,以弥合其基础模型和企业AI之间的差距。他们的Snorkel Flow功能包括Fine Tuning、提示构建器和“暖启动”,为数据科学和机器学习团队提供所需的工具,以有效地将基础模型用于性能关键的企业用例。

这导致Snorkel Flow和数据中心基础模型开发实现了与Fine Tuning的GPT-3模型相同的质量,部署模型小了1400倍,需要的真值_(GT)_标签不到1%,生产运行成本仅为0.1%。

如何在RAG与Fine Tuning之间做出选择

你应该根据用例和可用资源在RAG与Fine Tuning之间做出选择。虽然RAG是大多数用例的首选,但这并不意味着RAG和Fine Tuning是互斥的。虽然Fine Tuning并不总是最实用的解决方案——训练LLM需要大量的时间、计算和标记——但RAG也很复杂。

如果你有资源,那么同时利用两者肯定是有益的——训练你的模型从最有针对性的上下文数据集中提取最相关的数据。首先考虑你的具体需求,并做出对你的利益相关者驱动最大价值的决定。

无论你使用哪种方法,无论你使用哪一种,人工智能应用程序开发都需要数据管道,通过一些数据存储向这些模型提供公司数据。为了使你的AI正常工作,你需要关注模型依赖的数据管道的质量和可靠性。

RAG或Fine Tuning唯一能成功的方式是你能信任数据。为了实现这一点,团队需要利用数据可观察性——一种可扩展的自动化解决方案,以确保数据的可靠性,识别根本原因,并在影响服务的LLM之前快速解决问题。

最后的最后

感谢你们的阅读和喜欢,我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,如果你肯花时间沉下心去学习,它们一定能帮到你。

因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

  • 9
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值