开源大语言模型是否可以商用的调查报告

该报告详尽列举了多个开源大语言模型,包括基础模型、对话模型和多模态对话模型,分析了它们的许可内容和是否适合商用。部分模型如Baichuan-7B、Chinese-Falcon-7B、Aquila系列支持商用,而许多其他模型如LLaMA系列、ChatGLM等则限制于学术研究,禁止商业用途。企业在选择本地部署时需仔细阅读许可协议。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

0. 背景

ChatGPT 火起来了,很多企业想用 ChatGPT,但是又由于企业数据的保密性,所以本地部署开源大语言模型是不二之选。

各个企业本地部署大语言模型的第一步,就是调研哪些开源大语言模型可以商用。

本文对模型是否可以商用,主要调查了各个开源模型的许可内容及Model许可内容。

读者如果发现调查结果有需要修正的地方,欢迎在评论区留言或者发私信给我。

**免责声明:**由于作者知识和判断能力有限,此调查结果仅供参考,并不对调查结果负有任何责任。企业如果想使用某个开源模型,还请自行调查和判断。

1. 调查结果

1.1 基础大模型(LLM)

大规模基础模型:表格中只罗列出参数量大于7B以上模型。

模型 大小 时间 语言 领域 下载 项目地址 机构/个人 结构 文献 备注 模型是否可以商用
Baichuan-7B 7B 2023-06 中英 ckpt baichuan-7B 百川智能 Decoder baichuan-7B 支持商用。如果将 baichuan-7B 模型或其衍生品用作商业用途,请您按照如下方式联系许可方,以进行登记并向许可方申请书面授权:联系邮箱:opensource@baichuan-inc.com, 具体许可协议可见《baichuan-7B 模型许可协议》
Chinese-Falcon-7B 7B 2023-06 中英 ckpt Linly 深圳大学计算机视觉研究所 Decoder Blog 模型以 Apache License 2.0 协议开源,支持商业用途。
AquilaCode-7B-TS 7B 2023-06 中英 ckpt Aquila 智源研究院 Decoder 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。
Aquila-7B 7B 2023-06 中英 ckpt Aquila 智源研究院 Decoder 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。
Chinese-LLaMA-33B 33B 2023-06 中英 ckpt Chinese-LLaMA-Alpaca Yiming Cui Decoder Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。
TigerBot-7b-base 7B 2023-06 多语 ckpt TigerBot 虎博科技 Decoder 如需将模型公开使用或者商用,模型服务所产生的不良影响或者有害言论由服务方负责,本项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。
Panda-OpenLLaMA-7B 7B 2023-05 中英 ckpt pandallm dandelionsllm Decoder 可商用
Panda-13B 13B 2023-05 中英 ckpt pandallm dandelionsllm Decoder 不可商用
Panda-7B 7B 2023-05 中英 ckpt pandallm dandelionsllm Decoder 不可商用
OpenLLaMA-13B 13B 2023-05 中英 ckpt Linly 深圳大学计算机视觉研究所 Decoder Following LLaMA, our pre-trained weights are released under GNU General Public License v3.0
LaWGPT-7B 7B 2023-05 中英 法律 ckpt LawGPT Pengxiao Song Decoder 本项目任何资源仅供学术研究使用,严禁任何商业用途。
BiLLa-7B-LLM 7B 2023-05 中英 ckpt BiLLa Zhongli Li Decoder 本项目相关资源仅供学术研究,不得用于商业用途。
Ziya-LLaMA-7B-Reward 7B 2023-05 中英 ckpt Fengshenbang-LM IDEA研究院 Decoder Apache License 2.0 (作者注:并未明确表明禁止商用)
YuYan 11B 2023-04 中文 ckpt / 网易伏羲 Decoder Paper -
Chinese-LLaMA-33B 33B 2023-04 中文 ckpt Linly 深圳大学计算机视觉研究所 Decoder Blog LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。
Chinese-LLaMA-13B 13B 2023-04 中文 ckpt Linly 深圳大学计算机视觉研究所 Decoder Blog LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。
Chinese-LLaMA-7B 7B 2023-04 中文 ckpt Linly 深圳大学计算机视觉研究所 Decoder Blog LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。
OpenChineseLLaMA 7B 2023-04 中英 ckpt OpenChineseLLaMA OpenLMLab Decoder Non-commercial bespoke license
MOSS-003 16B 2023-04 中英 ckpt MOSS 复旦大学 Decoder 本项目所含代码采用Apache 2.0协议,数据采用CC BY-NC 4.0协议,模型权重采用GNU AGPL 3.0协议。如需将本项目所含模型用于商业用途或公开部署,请签署本文件并填写此问卷取得授权,商用情况仅用于记录,不会收取任何费用。
BBT-2-13B-Text 13B 2023-04 中文 申请下载 BBT-FinCUGE-Applications 超对称 Decoder Paper 未记述许可内容
BBT-2-12B-Text 12B 2023-04 中文 申请下载 BBT-FinCUGE-Applications 超对称 Decoder Paper 未记述许可内容
Chinese-LLaMA-13B 13B 2023-04 中英 ckpt Chinese-LLaMA-Alpaca Yiming Cui Decoder Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型
flan-ul2 20B 2023-03 多语 ckpt ul2 Google encoder-decoder Paper 未记述许可内容
CPM-Bee 10B 2023-01 中英 ckpt-10B ckpt-5B CPM-Live OpenBMB Decoder 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力!
BLOOM 176B 2022-11 多语 ckpt-95000 Megatron-DeepSpeed BigScience Decoder Paper The BigScience RAIL License
BLOOMZ 176B 2022-11 多语 ckpt-498 Megatron-DeepSpeed BigScience Decoder Paper The BigScience RAIL License
flan-t5-xxl 11B 2022-11 多语 ckpt t5x Google encoder-decoder paper Apache-2.0 license
CPM-Ant+ 10B 2022-10 中英 ckpt CPM-Live OpenBMB Decoder blog 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力!
GLM 130B 2022-10 中英 申请下载 GLM-130B 清华大学 Decoder paper You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes.
CPM-Ant 10B 2022-09 中文 ckpt CPM-Live OpenBMB Decoder blog 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力!
GLM 10B 2022-09 中文 ckpt GLM 清华大学 Decoder</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值