大模型开闭源之争，本质是商业化的争夺

最新推荐文章于 2024-08-06 22:00:00 发布

hhaiming_

最新推荐文章于 2024-08-06 22:00:00 发布

阅读量1.7k

点赞数 35

文章标签：人工智能 ai 开源软件

本文链接：https://blog.csdn.net/m0_70839135/article/details/140788407

版权

大模型从发展之初，即存在开源与闭源两条路线，孰优孰劣，也处于持续争论之中。2024年7月，在“2024世界人工智能大会”上，众多业内领军人物对大模型开闭源表达了针锋相对的观点。例如，百度创始人李彦宏站在闭源“阵营”，而百川的王小川、360的周鸿祎、猎豹的傅盛则持相反观点，双方均认为对方的路线是一种“智商税”。

历史规律

路线差异，结果一致

对于大模型开源闭源的孰优孰劣，以及未来发展前景如何，可以从软件产业开源与闭源的发展历史中，寻找到相应的发展规律。

首先，开源与闭源是对软件产品开发模式和商业模式不同的路径探索。具体对比如表1所示。

其次，开源与闭源的结果殊途同归。闭源一直有之；而开源，则起步于20世纪70年代的“自由软件运动”，后于1985年成立自由软件基金会，至20世纪90年代，完全的“自由”逐步被规范化、商业化的“开源”所取代，并在1998年成立了开放源代码促进会。从长期效果来看，两者并存并且各自推出了可相互媲美的产品，例如操作系统领域的Windows和Linux，数据库领域的Oracle与MySQL等。对于复杂的大型软件产品而言，即便前期是由软件爱好者共同开发出原始版本（如Linux），但最终也是由大企业负责后期商业版本的推进。

最后，开源与闭源的过程，体现了适用性的差异。一是产品类型的适用性问题。总体而言，开源适合通用型的工具产品，闭源则更适用于ERP等涉及深层次行业经验的产品（相关经验一般积累在企业的知识库中）。二是产品规模的适用性问题。总体而言，开源适合小规模的软件产品，闭源则更适合体量较大的软件产品，一些操作系统、数据库等在后期商业化进程中，亦偏向闭源经营模式。三是经营企业适用性。行业中绝对领先的企业基本采用闭源模式，以保证市场控制；而行业挑战者则偏好开源，可以快速打造产品和生态。

大模型现状

大企业主导开闭源之争

商业路线是核心

2022年11月，GPT-3.5的发布推动了大模型产业进入爆发性增长期，“百模大战”快速向“千模大战”迈进。在此过程中，开源与闭源路线一直是争议的焦点。

值得注意的是，大模型的开源与早期软件产业的开源有着显著不同。软件开源遵循“爱好者发布原型——群体性打磨——大企业打造发布版——代码开源而商业闭源——爱好者成为生态助力”；而大模型开源，则直接跳过了前两个阶段，直接由大企业发布代码开源产品，这导致了两个结果。

第一，产品质量取决于企业能力，与开闭源无关。若以闭源的ChatGPT为标杆，则闭源的产品质量一直保持领先。2023年下半年，以Meta的Llama3为代表的多个开源模型发布，在评测中有不少已超过GPT-3.5的能力，甚至接近GPT-4的能力；但2024年闭源Sora发布后，上述差距又被进一步拉大。

业内人士认为，产品质量的差距与是否开源基本无关，而取决于研发团队的能力，即团队可以调配的资金、算力和数据。在大企业对大模型代码开源后，开源社区对产品质量提升的幅度不足5%，基本可以忽略不计。一方面，大企业发布的产品完备性较高；另一方面，训练大模型成本高昂，已经不是开源社区内中小主体能够承担得起的，尤其是大规模参数模型训练。

第二，开闭源之争，实际是商业化的争夺。从历史经验可知，开源或者闭源，是不同企业对最适合自身的商业化路径选择。选择将大模型闭源的有OpenAI的ChatGPT、百度的文心一言、华为的盘古、商汤的日日新等，其共同特征是企业在各自的领域中均处于领先地位，闭源后拥有更好的自我保护能力，并可形成许可证销售等商业形态。而选择开源的Meta、谷歌、百川、360、阿里等企业，均是行业的追赶者，它们希望借助“Linux模式”，聚合生态力量，在商业上实现对领先者的赶超。至于处在“长尾”中的大模型厂商，它们的产品大多基于开源大模型而开发，因此亦为开源的拥护者。

大模型未来

“两条腿走路”

加速商业落地

大模型产业发展至今，进一步提升大模型质量固然重要，但更重要的是尽快实现商业落地。为此，2024年5月百度、火山等国内大模型厂商开启了“价格战”；同时，大模型厂商也形成共识，即实现大模型在行业场景中落地。

商业化成为大模型行业的重心，各个企业开源或闭源的路线选择亦是立足于企业的资源禀赋，服务于商业化路线，尤其是推动行业应用落地。着眼于未来发展，大模型行业将采用开源与闭源并存的“两条腿走路”发展策略，具体包括三种模式。

一是侧重闭源模式，但会叠加开源生态。上文提及在产业中具有显著领先优势的企业，如OpenAI、百度、华为等，仍然对各自的核心大模型产品采用闭源发展的模式，以实现绝对掌控权。但为了促进应用场景的落地，它们将叠加开源生态，其中包括插件市场的生态，如PPT制作、行业数据库接入等；以及衍生训练的大模型生态，如基于盘古大模型的行业大模型、场景大模型等。

二是侧重开源模式，但要打造基座产品。上文所提及的行业跟随者，如Meta、阿里、百川、360、猎豹等，是开源模式的拥护者。它们需要借助开源社区，提升基础大模型产品质量，使开发者直接使用谷歌、Meta等厂商的大模型进行训练，以及优化算法；同时需要实现产业生态的构建，在此过程中，将优先打造可供使用的“基座型”产品。

三是闭源与开源并存模式，选择适合的模型进行开源。其共同的特征是在较大模型上选择闭源，在较小模型上选择开源。如谷歌的“Gemma（开）+Gemini（闭）”组合、科大讯飞的“星火开源（开）+讯飞星火（闭）”组合、商汤科技的“书生（开）+日日新（闭）”组合等。开闭源的产品组合在强化对核心产品控制力的同时，也促进了生态发展。实际上，大参数模型由于训练成本较高，开源生态贡献较为有限。

从大模型整体发展来看，业界当前所聚焦的大模型算法开源或闭源，仅仅是一个方面，而训练数据的开源或闭源，也同样需要关注。笔者认为，未来的数据集仍将是以开源与闭源的方式并存，预计其中开源数据集将占据市场80%的数据量，主要解决大模型“可训练”的问题，并基于此形成通用大模型底座；而闭源数据集将占据市场20%的数据量，主要解决大模型“训练好”的问题，并基于此形成差异化大模型产品，尤其是面向行业或场景的大模型，这才是大模型厂商竞争的焦点。

hhaiming_

关注

35
点赞
踩
32

收藏

觉得还不错? 一键收藏
0
评论
大模型开闭源之争，本质是商业化的争夺

选择将大模型闭源的有OpenAI的ChatGPT、百度的文心一言、华为的盘古、商汤的日日新等，其共同特征是企业在各自的领域中均处于领先地位，闭源后拥有更好的自我保护能力，并可形成许可证销售等商业形态。而选择开源的Meta、谷歌、百川、360、阿里等企业，均是行业的追赶者，它们希望借助“Linux模式”，聚合生态力量，在商业上实现对领先者的赶超。而闭源数据集将占据市场20%的数据量，主要解决大模型“训练好”的问题，并基于此形成差异化大模型产品，尤其是面向行业或场景的大模型，这才是大模型厂商竞争的焦点。
复制链接

扫一扫