开源大语言模型是否可以商用的调查报告_大语言模型商业报告-CSDN博客

本文链接：https://blog.csdn.net/engchina/article/details/131334546

该报告详尽列举了多个开源大语言模型，包括基础模型、对话模型和多模态对话模型，分析了它们的许可内容和是否适合商用。部分模型如Baichuan-7B、Chinese-Falcon-7B、Aquila系列支持商用，而许多其他模型如LLaMA系列、ChatGLM等则限制于学术研究，禁止商业用途。企业在选择本地部署时需仔细阅读许可协议。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

开源大语言模型是否可以商用的调查报告

0. 背景
1. 调查结果
2. 可商用开源模型总结
- 2.1 基础大模型(LLM)
- 2.2 对话大模型(ChatLLM)

0. 背景

ChatGPT 火起来了，很多企业想用 ChatGPT，但是又由于企业数据的保密性，所以本地部署开源大语言模型是不二之选。

各个企业本地部署大语言模型的第一步，就是调研哪些开源大语言模型可以商用。

本文对模型是否可以商用，主要调查了各个开源模型的许可内容及Model许可内容。

读者如果发现调查结果有需要修正的地方，欢迎在评论区留言或者发私信给我。

**免责声明：**由于作者知识和判断能力有限，此调查结果仅供参考，并不对调查结果负有任何责任。企业如果想使用某个开源模型，还请自行调查和判断。

1. 调查结果

1.1 基础大模型(LLM)

大规模基础模型：表格中只罗列出参数量大于7B以上模型。

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	结构	文献	模型是否可以商用
Baichuan-7B	7B	2023-06	中英		ckpt	baichuan-7B	百川智能	Decoder		baichuan-7B 支持商用。如果将 baichuan-7B 模型或其衍生品用作商业用途，请您按照如下方式联系许可方，以进行登记并向许可方申请书面授权：联系邮箱：opensource@baichuan-inc.com，具体许可协议可见《baichuan-7B 模型许可协议》。
Chinese-Falcon-7B	7B	2023-06	中英		ckpt	Linly	深圳大学计算机视觉研究所	Decoder	Blog	模型以 Apache License 2.0 协议开源，支持商业用途。
AquilaCode-7B-TS	7B	2023-06	中英		ckpt	Aquila	智源研究院	Decoder		支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议，模型权重基于《智源Aquila系列模型许可协议》，使用者在满足许可限制的情况下，可用于商业目的。
Aquila-7B	7B	2023-06	中英		ckpt	Aquila	智源研究院	Decoder		支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议，模型权重基于《智源Aquila系列模型许可协议》，使用者在满足许可限制的情况下，可用于商业目的。
Chinese-LLaMA-33B	33B	2023-06	中英		ckpt	Chinese-LLaMA-Alpaca	Yiming Cui	Decoder		Facebook官方发布的LLaMA模型禁止商用，并且官方没有正式开源模型权重（虽然网上已经有很多第三方的下载地址）。为了遵循相应的许可，目前暂时无法发布完整的模型权重，敬请各位理解（目前国外也是一样）。Facebook完全开放模型权重之后，本项目会及时更新相关策略。这里发布的是LoRA权重，可以理解为原LLaMA模型上的一个“补丁”，两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用，需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。
TigerBot-7b-base	7B	2023-06	多语		ckpt	TigerBot	虎博科技	Decoder		如需将模型公开使用或者商用，模型服务所产生的不良影响或者有害言论由服务方负责，本项目开发者不承担任何因使用本项目（包含但不限于数据、模型、代码等）导致的危害或损失。
Panda-OpenLLaMA-7B	7B	2023-05	中英		ckpt	pandallm	dandelionsllm	Decoder		可商用
Panda-13B	13B	2023-05	中英		ckpt	pandallm	dandelionsllm	Decoder		不可商用
Panda-7B	7B	2023-05	中英		ckpt	pandallm	dandelionsllm	Decoder		不可商用
OpenLLaMA-13B	13B	2023-05	中英		ckpt	Linly	深圳大学计算机视觉研究所	Decoder		Following LLaMA, our pre-trained weights are released under GNU General Public License v3.0
LaWGPT-7B	7B	2023-05	中英	法律	ckpt	LawGPT	Pengxiao Song	Decoder		本项目任何资源仅供学术研究使用，严禁任何商业用途。
BiLLa-7B-LLM	7B	2023-05	中英		ckpt	BiLLa	Zhongli Li	Decoder		本项目相关资源仅供学术研究，不得用于商业用途。
Ziya-LLaMA-7B-Reward	7B	2023-05	中英		ckpt	Fengshenbang-LM	IDEA研究院	Decoder		Apache License 2.0 (作者注：并未明确表明禁止商用)
YuYan	11B	2023-04	中文		ckpt	/	网易伏羲	Decoder	Paper	-
Chinese-LLaMA-33B	33B	2023-04	中文		ckpt	Linly	深圳大学计算机视觉研究所	Decoder	Blog	LLaMA 原始模型权重基于 GNU General Public License v3.0 协议，仅供研究使用，不能用于商业目的。
Chinese-LLaMA-13B	13B	2023-04	中文		ckpt	Linly	深圳大学计算机视觉研究所	Decoder	Blog	LLaMA 原始模型权重基于 GNU General Public License v3.0 协议，仅供研究使用，不能用于商业目的。
Chinese-LLaMA-7B	7B	2023-04	中文		ckpt	Linly	深圳大学计算机视觉研究所	Decoder	Blog	LLaMA 原始模型权重基于 GNU General Public License v3.0 协议，仅供研究使用，不能用于商业目的。
OpenChineseLLaMA	7B	2023-04	中英		ckpt	OpenChineseLLaMA	OpenLMLab	Decoder		Non-commercial bespoke license
MOSS-003	16B	2023-04	中英		ckpt	MOSS	复旦大学	Decoder		本项目所含代码采用Apache 2.0协议，数据采用CC BY-NC 4.0协议，模型权重采用GNU AGPL 3.0协议。如需将本项目所含模型用于商业用途或公开部署，请签署本文件并填写此问卷取得授权，商用情况仅用于记录，不会收取任何费用。
BBT-2-13B-Text	13B	2023-04	中文		申请下载	BBT-FinCUGE-Applications	超对称	Decoder	Paper	未记述许可内容
BBT-2-12B-Text	12B	2023-04	中文		申请下载	BBT-FinCUGE-Applications	超对称	Decoder	Paper	未记述许可内容
Chinese-LLaMA-13B	13B	2023-04	中英		ckpt	Chinese-LLaMA-Alpaca	Yiming Cui	Decoder		Facebook官方发布的LLaMA模型禁止商用，并且官方没有正式开源模型权重（虽然网上已经有很多第三方的下载地址）。为了遵循相应的许可，目前暂时无法发布完整的模型权重，敬请各位理解（目前国外也是一样）。Facebook完全开放模型权重之后，本项目会及时更新相关策略。这里发布的是LoRA权重，可以理解为原LLaMA模型上的一个“补丁”，两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用，需要搭配原版LLaMA模型。
flan-ul2	20B	2023-03	多语		ckpt	ul2	Google	encoder-decoder	Paper	未记述许可内容
CPM-Bee	10B	2023-01	中英		ckpt-10B ckpt-5B	CPM-Live	OpenBMB	Decoder		模型训练完成后，你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具，你可以在自己的电脑上体验大模型的威力!
BLOOM	176B	2022-11	多语		ckpt-95000	Megatron-DeepSpeed	BigScience	Decoder	Paper	The BigScience RAIL License
BLOOMZ	176B	2022-11	多语		ckpt-498	Megatron-DeepSpeed	BigScience	Decoder	Paper	The BigScience RAIL License
flan-t5-xxl	11B	2022-11	多语		ckpt	t5x	Google	encoder-decoder	paper	Apache-2.0 license
CPM-Ant+	10B	2022-10	中英		ckpt	CPM-Live	OpenBMB	Decoder	blog	模型训练完成后，你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具，你可以在自己的电脑上体验大模型的威力!
GLM	130B	2022-10	中英		申请下载	GLM-130B	清华大学	Decoder	paper	You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes.
CPM-Ant	10B	2022-09	中文		ckpt	CPM-Live	OpenBMB	Decoder	blog	模型训练完成后，你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具，你可以在自己的电脑上体验大模型的威力!
GLM	10B	2022-09	中文		ckpt	GLM	清华大学	Decoder</