AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争

本文链接：https://blog.csdn.net/Langchain/article/details/142253211

一、引言

周日休息在家，只有码字才能缓解焦虑哈哈哈，闲逛CSDN发现又出新的话题活动啦——《开源大模型和闭源大模型，你怎么看》。“我怎么看？我坐着看，或者躺着看”。OpenAI变成CloseAI，你会发现，虚伪，是全世界的通病。扯远了哈哈，我认为，开源可以短时间让自家的大模型快速得到传播，构建影响力以及让行业内更多的人参与建设，完善技术栈。闭源可以维护较为健康的商业模式，高薪招聘更多优秀的人才继续进行迭代升级。存在即合理，从ios vs android，打到GPT4 vs LLama3，可能永远不会有胜负。今天我们详细聊聊中文大模型开闭源的那些事。

二、中文开/闭源大模型概览

大家先看《2024年中文大模型全景图》，对国内中文大模型开闭源情况有个概念。

在这里插入图片描述

Tips：图片引自SuperCLUE中文大模型基准测评2024年4月报告，国内领先的大模型评测公司，高中室友创办的，没想到毕业多年，兜兜转转进入到了一个行业，如需合作需要可以联系我哈

闭源大模型：主要有文心一言、通义千问、腾讯混元、字节云雀、MINIMAX、GLM-4、Baichuan4、Moonshot月之暗面等。

开源大模型：主要有baichuan2-13B-Chat、ChatGLM3-6B、Qwen1.5、Chinese-LLaMA-Alpaca-3等。

从商业模式上讲，又可以分为3类。

以百度、MINIMAX为代表的完全闭源大模型：只提供商业化接口，高版本收费、低版本免费。
以阿里为代表的部分开源、部分闭源：既提供商业化接口，又提供开源模型，两条腿走路，并驾齐驱都在升级迭代。
以百川为代表的前期低版本开源、后期高版本闭源：前期通过baichuan-13B、baichuan2-13B快速打出名气，后来更高版本的baichuan3、baichuan4只提供商业化接口。

目前国内大模型发展可以用“兵荒马乱”来形容，谁能在最后杀出重围，还需要时间去考量，下面针对开、闭源的优缺点，谈一谈个人想法。

三、开源大模型

3.1 优点

1、创新和灵活性：开源模型鼓励创新，研究人员和开发者可以自由探索和改进模型，推动技术的发展。

2、社区协作：开源社区的力量不可忽视，众多开发者共同参与，能够快速发现和解决问题，加速模型的优化和完善。

3、低成本和可访问性：开源模型通常是免费的，降低了使用门槛，使更多人能够受益于先进的技术。

4、透明度和可解释性：源代码公开，有助于更好地理解模型的工作原理，提高模型的可解释性和可信度。

5、适应多样化需求：开源模型可以根据不同的应用场景和需求进行定制和扩展，满足个性化的要求。

3.2 缺点

1、质量和稳定性：由于开源模型的开发和维护分散，质量和稳定性可能存在一定的差异。

2、缺乏商业支持：开源模型通常没有商业公司提供的专业支持和服务，在遇到问题时可能需要自己解决。

3、训练和部署难度：对于一些复杂的大模型，训练和部署可能需要较高的技术水平和计算资源。

4、数据隐私和安全：开源模型可能涉及数据的共享和使用，需要注意数据隐私和安全问题。

5、知识产权风险：在使用开源模型时，需要注意遵守相关的开源协议，避免知识产权纠纷。

四、闭源大模型

4.1 优点

1、质量和稳定性保障：闭源模型通常由专业的团队开发和维护，经过严格的测试和验证，质量和稳定性相对较高。

2、商业支持和服务：商业公司提供闭源模型时，通常会附带专业的支持和服务，包括培训、技术支持等。

3、易于使用和集成：闭源模型通常提供了友好的用户界面和 API，便于开发者使用和集成到自己的系统中。

4、数据隐私和安全保护：商业公司通常会采取措施保护用户的数据隐私和安全。

5、持续更新和改进：商业公司会不断对闭源模型进行更新和改进，以提供更好的性能和功能。

4.2 缺点

1、成本较高：闭源模型通常需要用户购买许可证或订阅服务，成本相对较高。

2、缺乏透明度：用户无法直接查看模型的源代码，对模型的工作原理和内部机制了解有限。

3、定制和扩展性受限：闭源模型的定制和扩展性可能受到一定的限制，无法完全满足个性化需求。

4、社区参与度低：相比开源模型，闭源模型的社区参与度较低，开发者之间的交流和合作相对较少。

5、依赖供应商：用户对闭源模型的使用和发展较为依赖供应商，一旦供应商出现问题，可能会影响用户的使用。

五、总结

可以看到，开源和闭源模型各有其优缺点，选择适合自己需求的模型需要综合考虑多方面因素。在实际应用中，可以根据具体情况权衡利弊，并结合自身的技术能力和资源来做出决策。此外，随着技术的不断发展，开源和闭源模型的界限也在逐渐模糊，一些商业公司也开始采用开源的模式来推动技术的进步。

对于AI智能体开发而言，个人实际工作中，既使用闭源商业化接口，首先是省心，不用自己申请机器、部署、维护模型服务；其次是省钱，相较于购买GPU显卡，价格战下的商业接口便宜的可怕；最后是真的很好用，一般商业化的接口模型尺寸都要高于开源版，Agent开发过程中调用一些Tools就能达到极好的效果。又使用开源微调私有化部署模型，首先是安全，考量到数据安全，业务数据轻易不能外漏，安全意识很重要，如果外泄未来可能是雷区；其次是可微调，使用较大尺寸的模型，配以精选后的微调数据，画风上明显会有一定提升；最后是杀鸡焉用牛刀，对于一些简单任务，比如任务判断、工具选择、文本处理等一些简单但重复度高的工作，使用私有化部署的模型，长期看是可以节约成本的。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望