搞懂大模型中的提示工程、RAG和微调

我们都知道大模型非常火,很多人想必也都用过不少AI产品,比如百度的文心一言、字节的豆包、阿里巴巴的通义千问、腾讯的元宝、月之暗面的Kimi智能助手等等。

那么对于提示工程、RAG(检索增强)和微调,在工程当中,我们应该怎么去选择呢?

我们先要搞清楚,大模型是怎么训练出来的?

首先需要有海量的数据,然后通过训练,来构造一个大模型。

训练好的大模型,具备了很多的能力,因为在我们训练的过程中,使用到的数据是非常多样化的,包括各个行业、各个领域的数据。

从另外一个角度,我们可以把大模型比作是智能化的大脑,比如说是人的大脑。

假如这个大脑就是我,它具备了金融领域的能力、教育领域的能力、管理的能力等等。

下面通过一个具体的例子,来理解一下提示工程、RAG和微调之间的区别和联系。

假如你有一个问题想要问我,然后你问了我一个问题,但是我没有给出你想要的答案。

那么接下来,我们来分析一下,我没有给出你一个正确答案的原因。

1、提示工程

第一种情况,可能你没有问清楚,也就是你没有让我明白,你想要做什么。

这个时候呢,你就要换一种更准确的表述方式,让我听明白你想要做什么,这样我才有可能帮到你。

那这个过程,本质上就对应到了提示工程。

接下来我们通过提示工程,就能解决你没有问清楚的问题。

到这里就结束了。

2、RAG

如果用了上述提示工程,还是没有解决得不到想要的答案的问题。

那么,我们就要考虑第二种情况。

第二种情况,有可能是我欠缺相关领域的知识。

比如,你问了我一个关于光伏发电方面的问题,由于我对光伏发电这个行业不了解,欠缺该领域的知识,所以目前我是帮不到你的。

这个时候,该怎么办呢?

一个比较好的解决方案就是,你可以围绕问题,把光伏发电行业相关的一些背景知识给我讲清楚,让我至少能了解问题的背景、问题的场景以及要解决的问题的本身。

有了这些相关的知识,也可以理解为上下文之后,我就有可能可以帮到你。

那这个过程呢,本质上就对应到了RAG,检索增强。

接下来我们通过RAG,就能解决我欠缺相关领域知识的问题。

到这里就结束了。

3、微调

如果用了上述提示工程和RAG,还是没有解决得不到想要的答案的问题。

那么,我们就要考虑第三种情况。

第三种情况,有可能是我自身能力不足。

也就是说,我的提供解决方案的能力以及方法论有待提高。

所以这个时候,我可能需要反过来去提升自己。

因为基于现在的能力,即便你给我提供了很详细的相关知识,让我弄清楚了这个问题的本身,我可能也没有办法帮到你。

所以等我提高我自己之后,我再反过来帮你,有可能会给你一个满意的答复。

那这个过程呢,本质上就对应到了模型的微调。

就是不要去抱怨各种外部的环境,而是先重点提升自己。

微调本身,也是对大模型本身的一个改造。

但是提示工程和RAG,对大模型是没有做任何的改造的。

综上所述呢,在工程当中,我们应该从提示工程开始,然后到RAG,最后到模型的微调。

不要一开始就要做模型微调。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 28
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值