企业落地大模型的路径选择:微调、RAG、提示词工程

一、大模型的特点

1)不确定性 与传统应用不同,模型的输出是不确定的,即使多次问它一样的问题,给出的结果也可能不一样。这种特性对于日常应用业务 OK,但是如果要在企业内用来处理具体业务问题,就必须提高这个稳定性,否则影响生产经营,例如产线操作人员通过模型获取操作步骤或者参数,如果步骤或者数据不对可能会导致产品出现质量问题等等。

2)静态性 模型一旦训练好,就无法再补充数据,因此模型不会了解你自己组织内部的年假规定,注意事项。如何让大模型掌握这些数据是另外一个需要解决的问题。

上述问题会影响大模型在企业内部的使用,因此针对模型的优化主要会有 两个方向:

行为优化: 对应上图横轴,横轴表示大模型的表现能力,让大模型做它原来不会做的事情,例如以一个医学专家的方式进行表达,或者其他新的方式进行表达,并且它能理解。这个维度主要解决模型输出形式上的稳定性。

上下文优化: 对应上图竖轴,竖轴表示大模型的知识能力,这个纬度主要关注私域数据,是让模型知道它所不知道的事情,包括:模型训练中从未见过的数据,比如内部代码、文档、规范、策略等。这个维度主要解决模型输出内容上的相关性。

二、针对大模型的优化主要有三种方法:

方法 1 提示工程(Prompt Engineering)

提示工程(Prompt Engineering)是指通过精心设计、实验及优化输入文本(即提示),来引导大型预训练语言模型(如 GPT)生成更精准、高质量输出的过程。这门技术让非编程用户也能通过类似于“指令”的方式与 AI 交互,有点类似软件工程在 AI 时代的化身。其优点包括任务归一化,简化多样任务处理流程,并能灵活适应广泛需求。缺点主要是“门槛低,落地难”,找到高效提示往往依赖反复试验且效果不稳定。

提示词工程是最经济可行,也是见效最快的方式;在生成式 AI(GenAI)这个领域中大家经常听说的 零样本/多样本学习(Zero-short/Few-short learning)或者 上下文引导学习(in-context learnning)其实都是提示词工程中的一些具体方法和技巧。在实际应用中,应该首先考虑使用提示工程的方式优化大模型应用,这是成本最低,见效最快的方式。提示词工程可以同时为模型补充上下文(上下文优化)和优化模型的行为(行为优化)。因此提示词工程可以同时在以上 2 个维度上帮助我们提升模型的性能、质量和用户体验,让我们可以更快达到目标。对任何应用场景,我们都不建议在还没有尝试提示工程的前提下就开始引入 RAG 或者微调

方法 2 - 检索增强式内容生成(RAG - Retrieval Augmented Generation)

RAG 并不是某种系统/工具/产品,RAG 是一种为模型补充知识的方法。首先,任何的大模型一旦训练完成就变成了一个静态的文件,它只存储了在训练过程中提供给它的知识(数据)。因此,当你问 ChatGPT 自己公司内部规章制度的相关规定,它必定无法准确回答,而且还会给出误导性的答案。为了解决这个问题,最简单的方式就是先告诉大模型这些规定,然后再让它回答。这种方式就是提示词工程中的多样本学习(few-short learning)。同时,大模型是没有记忆的,你提出的每一个问题其实对他来说都是全新的问题。当我们需要为模型提供更多上下文的时候,就需要用到 RAG 技术。RAG 是在给模型发送消息之前首先进行内容检索,从其他数据源把相关的数据先提取出来,然后插入到当前对话消息中给到模型,这样就解决了既要让模型知晓大量它不知道的知识,又避免消息窗口不够的局限。

方法 3 - 微调 (Fine-tuning)

大模型微调是在预训练好的大规模模型基础上,针对特定任务或领域,使用相关数据对其进行进一步训练,以优化模型在此任务上的性能。此过程“微调”而非重新训练,旨在保留模型的泛化能力同时提升其专域精确性,微调之所以称为微调,就是因为微调不是从零开始,是基于一个预训练好的基础模型通过继续训练来调整模型行为的方式来完成的。这个过程所使用的数据量远远小于预训练模型所需要的数据量(基本在基础训练量的 1%左右 ),只需要能够可以在一定程度上改变模型的行为就够了。微调的作用主要是对模型的行为进行调整,虽然也可以通过这个过程为模型补充数据,但是并不能保证模型就一定会按照你补充的数据回答问题,因为模型并不是一个确定性系统。这种调整需要构建在模型本身已经具备的能力上,这个过程和我们所说的熟能生巧和举一反三的过程很像。

三、企业落地大模型的具体步骤

在实际应用中,将大型预训练模型融入特定业务场景并非一蹴而就,而是涉及一系列细致且策略性的步骤,从基础模型的选择到最终的微调与知识集成

1、基础模型的选择

一切始于基础模型的甄选,这是决定项目成功与否的基石。首先,根据业务的具体需求和可承担的成本,评估不同模型。大参数量的模型通常表现出色,但随之而来的是对计算资源的高要求。为此,建议先整理出业务场景中的一系列典型问题,并利用这些作为测试基准,对开源的大模型进行实测。通过观察模型的回答质量,结合其资源消耗情况,给予评分,从而综合考量选出最适宜的基础模型。这一阶段如同在众多考生中挑选最具潜力者,初步奠定项目的基调。

2、提示词优化输出

在基础模型选定后,下一步是优化其输出以更贴合业务需求。初始尝试可从简单的提示词开始,引导模型输出期望的结果。若效果不尽人意,则采用 few-shot 学习方法,即通过提供少量示例输入,让模型“学习”如何在特定情境下作答。这如同在考试前告知考生考题范围,虽未直接给出答案,却能有效指引思考方向。实践中,少数精心设计的案例就能显著提升模型的表现力。

3、RAG

为了进一步提升用户体验并减少交互时频繁输入提示的负担,引入 Retrieval-Augmented Generation (RAG)技术显得尤为重要。该技术结合知识库,允许模型在响应前查询相关信息,如同开卷考试时可查阅的书籍,使回答更为精准全面。这样不仅减轻了用户输入提示的负担,还增强了模型的泛用性和知识深度。

4、微调:定制化的深造之路

当基本框架建立且初步优化后,面对特殊领域或高精度需求,微调成为提升模型表现的关键步骤。这一步骤类似于学生在掌握了基本知识后,针对特定科目进行深入学习。通过在特定数据集上对模型进行针对性训练,使之对特定领域的知识有更深入的理解和应用能力。尽管微调能够显著提升模型的定制化程度,但它也伴随着较高的时间和经济成本,且难以快速适应环境变化。

5、结合知识库与微调,双管齐下

在实践中,微调往往与知识库的集成并行进行,两者相辅相成。知识库为模型提供了丰富的背景信息,而微调则让模型学会如何灵活运用这些信息。特别是对于那些需要高度个性化的场景,比如情感陪伴或心理健康支持,这种深度定制变得尤为关键。尽管微调可能不如即时的提示调整或知识检索那样即时生效,但它所带来的长远效益——即模型在特定领域的深入理解和高效应对,是其他方法难以替代的。

综上所述,将大型模型应用于实际业务场景,是一个从模型选型、初步优化到深度定制的渐进式过程。每一步都是对模型性能与效率的权衡,也是对业务需求深刻理解的体现。通过这一系列精细操作,我们不仅能赋予模型更强的业务适应能力,还能在特定领域内挖掘出其最大的价值潜力。

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 18
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT猫仔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值