简单三个案例来分析RAG、微调如何选择？

最新推荐文章于 2024-07-23 10:16:01 发布

程序猿赵高

最新推荐文章于 2024-07-23 10:16:01 发布

阅读量1.3k

点赞数 34

文章标签：人工智能深度学习程序人生 AI编程语言模型健康医疗

本文链接：https://blog.csdn.net/m0_57081622/article/details/139862318

版权

我们重点来讨论几个案例，来看一下每个案例到底选择RAG，还是微调，或者是RAG+微调。

第一个案例：比如说我们想打造一个AI的投资理财规划师，比如我根据用户的风险偏好，还有一些用户的情况来给他一个合理的建议，比如说基于一些目前市场上的情况，那这种AI的规划师我们到底怎么打造？那这里我们需要考虑的是RAG还是微调呢？大家可以先思考一下。

那为了回答这个问题，我们首先要剖析那这样的系统它到底需要具备什么样的能力？

1、第一个很重要，就是可以处理实时的数据，或者叫动态的数据；

2、它也需要具备很强的对话能力；

3、它也需要具备一定的金融行业的背景，也就是需要有金融能力。

那我们一个一个来看一下：

第一点：对于动态数据来讲，前面一篇文章也说到过RAG肯定是最适合去处理动态数据的，它可以从市场上抓取一些相应的数据，比如说实时的数据来去解决用户的问题。

第二点：很强的对话能力，它其实指的是上一篇文章所说到的第六点，就是我们的AI规划师，它需要具备通用模型所具备的很强的对话能力，所以很显然这里还是RAG，如果我们进行微调的话，它有可能会失去比较流畅的对话能力。

第三点：金融能力，那实际上其实市面上很多效果比较好的通用大模型，它其实也具备一定的金融能力的，因为在训练的时候，大模型已经被灌输了很多跟金融相关的数据，所以有可能微调在这里可能是不太必要的。

假如我们想打造这样的AI投资理财规划师，那我们首选大概率是RAG。

第二个案例：那第二个场景，比如我们想打造一个金融领域的信息抽取的Bot，比如说我希望AI可以去看一个研究报告，然后把研究报告里的一些相应的关键的信息把它取出来，或者甚至编写类似格式的研究报告。那对于这个场景用RAG？还是微调呢？

跟上面的例子一样，我们首先要理清楚它到底需要具备什么样的能力？

1、这里很明显，它需要具备很强的抽取能力。

2、其次它也需要具备一定的金融领域的能力，也就是对金融领域的一些文本，它需要有一个比较强的理解能力，那以至于像对话能力在这个场景里面是不太需要的。

第一点：对于抽取能力，我们可能大概率需要微调，因为它属于一个特定的能力，而且通用大模型的大概率可能对于这个特定的能力是比较弱的，所以我们需要通过一些微调的方法来加强这个能力。

第二点：其实跟上面是一样的，在这个场景下，我也不太需要去处理什么动态的数据，因为我们只是希望给定一个信息，然后从这个信息里面去抽取我们想要的东西。

综上所述，那对于第二个场景，实际上大概率需要做微调。

第三个案例：比如我们想做一个销售机器人，比如我们希望AI可以帮助我们去卖产品，比如说卖给用户或者卖给企业，那对于这个场景，我们使用RAG还是微调呢？

还是跟上面一样，我们要列出它所需具备哪些能力？

1、是我们需要大量的一些产品的数据，比如我们希望AI去卖东西，那肯定它得知道产品到底是什么，而且产品本身它是经常会改变的。所以产品数据，实际上要作为一个知识库，然后给我们的大模型去使用，所以这个对应到RAG。

2、关于销售的技巧和语气本身也比较重要，因为销售跟客服是不太一样的工作模式，因为客服更像是一个被动式的，所以你只要有问题问我，我只要提供回复即可。销售更多是一个主动的模式，这里面就很考验各方面能力，比如说销售的流程、销售的技巧、以及我以什么样的口吻去跟客户去交流，所以不同的公司它有不同的销售流程，而且即便在同一个公司里面，不同的销售人员，他采用的语气还有一些技巧也是不一样的，所以这些能力本身呢，可能大概率也没有办法用通用大模型来解决，可能需要微调。

根据上面总结下来，第三个案例需要RAG+微调

既然大模型现在这么火热，各行各业都在开发搭建属于自己企业的私有化大模型，那么势必会需要大量大模型人才，同时也会带来大批量的岗位？“雷军曾说过：站在风口，猪都能飞起来”可以说现在大模型就是当下风口，是一个可以改变自身的机会，就看我们能不能抓住了。

那么，我们该如何学习大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、大模型全套的学习路线

学习大型人工智能模型，如GPT-3、BERT或任何其他先进的神经网络模型，需要系统的方法和持续的努力。既然要系统的学习大模型，那么学习路线是必不可少的，下面的这份路线能帮助你快速梳理知识，形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别：AI大模型API应用开发工程

L3级别：大模型应用架构进阶实践

L4级别：大模型微调与私有化部署

一般掌握到第四个级别，市场上大多数岗位都是可以胜任，但要还不是天花板，天花板级别要求更加严格，对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线，不知道为什么发出来就有点糊，高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

程序猿赵高

关注

34
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
简单三个案例来分析RAG、微调如何选择？

我们重点来讨论几个案例，来看一下每个案例到底选择RAG，还是微调，或者是RAG+微调。：比如说我们想打造一个AI的投资理财规划师，比如我根据用户的风险偏好，还有一些用户的情况来给他一个合理的建议，比如说基于一些目前市场上的情况，那这种AI的规划师我们到底怎么打造？那这里我们需要考虑的是RAG还是微调呢？大家可以先思考一下。那为了回答这个问题，我们首先要剖析那这样的系统它到底需要具备什么样的能力？1、第一个很重要，就是可以处理实时的数据，或者叫；2、它也需要具备；
复制链接

扫一扫