国内AI大模型已近80个，哪个最有前途？

本文链接：https://blog.csdn.net/CSDN_430422/article/details/142658019

Github上的一个名为Awesome LLMs In China的项目帮我们详细的总结了截至目前为止的所有国产大模型的基本情况。

这个列表中目前共有大模型243个，我真的是不禁感慨自己之前的孤陋寡闻，万万没想到国产大模型家族已经如此庞大。

不过可惜的是，有很多模型既无官网也无APP，只有一个名字和一个出品公司，虽然名字都很霸气，但性能怎样却是无从得知了。

这些大模型的专注领域各有不同，比如百度的文心一言、科大讯飞的星火、智谱华章的清言、百川智能的百川、阿里云的通义千问等是可以陪我们普通人聊天的通用大模型，而像北京大学的ChatLaw则是专注法律问题的大模型，学而思的MathGPT则是专注于算法讲解的大模型。

我对于这种“小而专”的模型更感兴趣，所以试用了一下ChatLaw和MathGPT。

先来看ChatLaw的回答：

很遗憾，我足足等了一个多小时，ChatLaw也一直没能输出答案，看来这个demo版距离落地应用恐怕还有很长很长的路要走。

我用MathGPT随便生成了一道题：

我觉得解析效果还是不错的，能够达到一般教学参考书的水平。而且与一般的辅导书相比，显然这个大模型更加灵活，能够随时解答学生遇到的问题。

其实，不管是这种「小而专」的模型，还是「大而全」的模型，未来都会越来越多，几乎所有企业都得用模型重塑一下业务形态，这个过程就会重塑很多机会，所以先别管哪个大模型最有前途，咱们都实际点关注下自己在 AI 大模型浪潮中的前途。现在很多工作其实都具备「被 AI 化」的潜力，很多岗位也都即将引入各种AI应用，如果一点都不懂AI，很可能在未来被无情抛弃。

听一听，就可以知道同事使用的那些看起来“玄乎其玄”的AI应用到底用了什么Al技术，如果继续往下学，还能拿到28个可以直接迁移到个人项目中的demo代码*，没有门槛，快速上手。

现在日常工作中我已经离不开大模型的协助，无论是编写代码，还是润色文章，大模型的表现堪比一个能力超群的助手。不过通用大模型能力虽然强大，但是由于其“通用性”，对于特定任务的表现可能并不完美，与之相比，微调模型可能具有更好的效果。

我们现在已经有包括智谱清言、百川、通义千问在内的众多开源模型，这些模型均提供了大小不同的可供微调的模型。作为一个只拥有一块卡的穷人，我决定选择智谱清言的chatglm3-6b玩一玩，试试看。

微调之前当然要先看看chatglm3-6b的推理能力，比如是不是可以“说人话”，说的人话是不是有道理：

建议试验前可以先把模型文件拖到本地，因为无论如何，终究是需要把模型文件下载到本地的：

其实把大模型文件下载到本地主要是为了提高性能和效率，因为本地执行时，数据不需要通过互联网反复传输，可以显著提升响应速度。此外，如果在需要离线使用或有严格数据隐私要求的环境中，本地使用模型可以避免发送数据到外部。

我向chatglm提出了三个“灵魂拷问”：

经过漫长的等待后，模型终于输出了结果：

可惜我想根据说明进行微调的时候杯具了，人家明确表示，必须有“单机多卡”或“多机多卡”才能实现微调。

但是它同时提供了一个demo网页版，供我们测试使用！

基于python3.10建好环境，根据requirements准备好所有依赖——

整合了Chat、tool和Code Interpreter的Demo成功启动——

可以发现，这个ChatGLM的综合Demo，就与我们平时使用的清言聊天大模型有很大的不同。

在Chat模式下：

用默认的参数，ChatGLM一本正经的输出了答案。

我随便调了调左侧的几个参数，大模型“罢工”了……

我把长度调整为7947后，模型的输出结果卡Bug了，像复读机一样开始不停输出“以及旅游的时间/目的和预算”……

所以说，虽然可调的参数并不是很多，但是调整起来同样需要技巧，否则一个不小心，大模型就被玩坏了，不能愉快的陪我们聊天了。

再来试试demo的工具模式，比如我想知道天津明天的天气情况：

竟然报错了，吓我一跳，我以为还没玩工具模式就坏了……幸好模型自己马上更正了错误：

但是由于只是一个Demo，不能连接互联网，所以问了天气预报以外的问题后，模型开始“胡说八道”——

不过根据说明来看，用户可以自己设置外部工具接入模型，模型就可以查询一些股票价格、实时金价、热点新闻之类的内容。

最后试一下Code Interpreter的功能，比如让它用python帮我们画一颗心：

它对于自己无法直接生成图形表示了歉意，让我自己本地运行画出这个“心”。我试了一下，挺好看的一颗爱心：

然后我突发奇想，让模型帮我设计一组代码，可以输出一个类似于机器猫的形状：

模型开始进入了无休无止的“报错+道歉模式”——

显然从代码来看，demo模型没有理解“机器猫”的意思，虽然不断的努力修正代码，但直到最后也是不得要领。

最后我决定拿着这个问题去难为一下ChatGPT，它想了半天，建议我先画一张脸凑合着看：

Emmm，虽然这货和机器猫（Robot Cat）一毛钱关系都没有，不过总算占了个Robot，偷偷把Cat换成了Face啥的，原谅它吧。

总的来说吧，目前国产大模型种类繁多，涉及的领域和专业也是不计其数，很难一概而论的评价哪个大模型最有前途。

但是我觉得对于提高工作效率来说，还是开源大模型的潜力更大一些。只要明确自己的需求、目标、数据，微调一个大模型，可以有效帮我们完成一些无聊的重复性工作，简单写个代码啥的也完全没有问题。

随着算力等硬件基础设施的不断完善，训练数据的进一步扩充和优化，以及模型架构的持续创新，相信在不久的将来，我们就能看到真正有竞争力、甚至领先全球的国产大模型诞生。

与此同时，无论国内还是国外，都在努力探索大模型的应用落地方向。前面提到的面向法律、教育等专业领域的大模型，就是AI技术赋能传统行业的典型案例。未来，随着大模型技术的不断进步和完善，必将在更多领域大放异彩，为各行各业的数字化转型和升级注入强劲动力。

那么，如何系统的去学习大模型LLM？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

篇幅有限，部分资料如下：

👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点，扫盲必看！
在这里插入图片描述
💥既然要系统的学习大模型，那么学习路线是必不可少的，这份路线能帮助你快速梳理知识，形成自己的体系。

路线图很大就不一一展示了 （文末领取）
在这里插入图片描述

👉大模型入门实战训练👈

💥光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥两本《中国大模型落地应用案例集》 收录了近两年151个优秀的大模型落地应用案例，这些案例覆盖了金融、医疗、教育、交通、制造等众多领域，无论是对于大模型技术的研究者，还是对于希望了解大模型技术在实际业务中如何应用的业内人士，都具有很高的参考价值。 （文末领取）
在这里插入图片描述

👉GitHub海量高星开源项目👈

💥收集整理了海量的开源项目，地址、代码、文档等等全都下载共享给大家一起学习！
在这里插入图片描述

👉LLM大模型学习视频👈

💥观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。 （文末领取）
在这里插入图片描述

👉640份大模型行业报告（持续更新）👈

💥包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

👉获取方式：

这份完整版的大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓