如果老板让你基于大模型搭建一个系统，怎么选择一个适合自己任务的大模型？选择大模型需要考虑哪些问题？-CSDN博客

本文链接：https://blog.csdn.net/m0_59163425/article/details/140859134

“怎么选择和测试一款大模型，是一个需要思考的问题”

到今天为止，市面上的大模型没有一万也有三千；如果算上那些学习使用的大模型，可能几十万都不止。

但对企业来说，要想构建一个企业级的AI应用，最好的选择就是使用第三方大模型或者使用开源大模型，那么在如此多的模型中，怎么选择一个适合自己任务的大模型呢？‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

个人开发的人工智能聊天小程序，感兴趣的可以点击查看：‍‍

01.为什么要选择模型？

这两年市面上的模型如雨后春笋般不断涌现，而且模型的能力也在不断加强。但不论是对个人还是企业来说，东西多了反而不知道该怎么选了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

有句老话叫：“没有最好的，只有最合适的”；这句话放到大模型上也是一样，不论是对个人还是对企业，怎么选择一个好的模型，是一个值得思考的问题。‍‍

对个人来说，如果学的是自然语言处理，那么选择一个图片处理的模型就走偏了。

而对一家企业来说，选择模型需要考虑的问题就更多了，比如模型的功能是否满足需求，模型的响应速度，数据安全问题，更新频率以及是否有完善的文档，更重要的是使用模型的成本问题。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

‍

而目前由于大模型的应用还处于初级阶段，虽然搞了一年多的千模大战，但真正能把大模型贴合到具体的应用场景中，还处于探索的阶段。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

因此，市面上也很难见到完整的大模型企业级解决方案；而今天就来简单讨论一下怎么选择一个适合的大模型；也可以说是选择模型的一个简单方法论。‍‍‍‍‍‍‍

02.怎么选择模型？

无论做任何事，都会有固定的几个步骤，选择模型也不例外；而怎么选择模型，总结了以下几个步骤：‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

_明确任务需求_‍

选择大模型之前，第一步就是要确定任务需求，也就是说你想用大模型干什么？只有明确了任务需求，才能知道应该选择什么样的大模型。

举例来说，你想利用大模型做一个具有图像处理功能的大模型，那么你选择自然语言处理的模型就肯定不合适。

在明白需求的情况下，你才知道怎么想干嘛，以及能干嘛。

确定模型类型和架构

根据任务需求，筛选符合任务功能的模型；比如说，同样都能进行图片处理的大模型，是选择开源的，还是商业闭源；是选择AGI(通用人工智能)这种能够进行多模态处理的大模型，还是选择垂直领域内的模型。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

_评估大模型和基础能力_‍‍‍‍‍‍‍‍‍‍‍‍

在确定大模型的类型之后，就可以对模型进行简单的评估；不论是使用官方给出的评测结果，还是自身的评测手段，比如自己整理一部分业务数据做成测试集，然后丢到模型中进行交叉测试。‍‍‍‍‍‍‍‍‍‍‍‍

评估大模型不但要评估大模型的基础能力，同时还要看大模型的响应速度，是否支持大数据量处理，大模型是否会经常更新等。

选择模型

在确定了前面几个步骤之后，可能会有几个模型供我们选择；这时我们就需要对它们进行筛选了，如果说前面的步骤是硬性条件，那么现在就需要筛选一些软性条件。‍‍‍

比如说，这款大模型的文档是否完善，文档更新是否及时；以及，如果是第三方大模型，那么使用大模型的成本是否合适。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

还有就是，大模型是否能本地部署，本地部署需要的成本有多少，需要多少硬件设备，以及需要多少人力进行维护。还有就是数据安全问题，是否能够得到保障等。‍‍‍‍‍

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

总之，选择大模型是一个复杂的过程，特别是不使用第三方模型的情况，自己部署大模型的情况下。

使用第三方模型，如果觉得效果不好换一家就行了；但如果本地部署大模型，如果表现不好那么前期的人力和硬件资源的投入就无法收回了。‍‍‍‍‍‍

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述