开源大语言模型是否可以商用的调查报告
0. 背景
ChatGPT 火起来了,很多企业想用 ChatGPT,但是又由于企业数据的保密性,所以本地部署开源大语言模型是不二之选。
各个企业本地部署大语言模型的第一步,就是调研哪些开源大语言模型可以商用。
本文对模型是否可以商用,主要调查了各个开源模型的许可内容及Model许可内容。
读者如果发现调查结果有需要修正的地方,欢迎在评论区留言或者发私信给我。
**免责声明:**由于作者知识和判断能力有限,此调查结果仅供参考,并不对调查结果负有任何责任。企业如果想使用某个开源模型,还请自行调查和判断。
1. 调查结果
1.1 基础大模型(LLM)
大规模基础模型:表格中只罗列出参数量
大于7B
以上模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 结构 | 文献 | 备注 | 模型是否可以商用 |
---|---|---|---|---|---|---|---|---|---|---|---|
Baichuan-7B | 7B | 2023-06 | 中英 | ckpt | baichuan-7B | 百川智能 | Decoder | baichuan-7B 支持商用。如果将 baichuan-7B 模型或其衍生品用作商业用途,请您按照如下方式联系许可方,以进行登记并向许可方申请书面授权:联系邮箱:opensource@baichuan-inc.com, 具体许可协议可见《baichuan-7B 模型许可协议》。 | |||
Chinese-Falcon-7B | 7B | 2023-06 | 中英 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | 模型以 Apache License 2.0 协议开源,支持商业用途。 | ||
AquilaCode-7B-TS | 7B | 2023-06 | 中英 | ckpt | Aquila | 智源研究院 | Decoder | 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。 | |||
Aquila-7B | 7B | 2023-06 | 中英 | ckpt | Aquila | 智源研究院 | Decoder | 支持开源商用许可。Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。 | |||
Chinese-LLaMA-33B | 33B | 2023-06 | 中英 | ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。请参考本项目给出的合并模型步骤重构模型。 | |||
TigerBot-7b-base | 7B | 2023-06 | 多语 | ckpt | TigerBot | 虎博科技 | Decoder | 如需将模型公开使用或者商用,模型服务所产生的不良影响或者有害言论由服务方负责,本项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。 | |||
Panda-OpenLLaMA-7B | 7B | 2023-05 | 中英 | ckpt | pandallm | dandelionsllm | Decoder | 可商用 | |||
Panda-13B | 13B | 2023-05 | 中英 | ckpt | pandallm | dandelionsllm | Decoder | 不可商用 | |||
Panda-7B | 7B | 2023-05 | 中英 | ckpt | pandallm | dandelionsllm | Decoder | 不可商用 | |||
OpenLLaMA-13B | 13B | 2023-05 | 中英 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Following LLaMA, our pre-trained weights are released under GNU General Public License v3.0 | |||
LaWGPT-7B | 7B | 2023-05 | 中英 | 法律 | ckpt | LawGPT | Pengxiao Song | Decoder | 本项目任何资源仅供学术研究使用,严禁任何商业用途。 | ||
BiLLa-7B-LLM | 7B | 2023-05 | 中英 | ckpt | BiLLa | Zhongli Li | Decoder | 本项目相关资源仅供学术研究,不得用于商业用途。 | |||
Ziya-LLaMA-7B-Reward | 7B | 2023-05 | 中英 | ckpt | Fengshenbang-LM | IDEA研究院 | Decoder | Apache License 2.0 (作者注:并未明确表明禁止商用) | |||
YuYan | 11B | 2023-04 | 中文 | ckpt | / | 网易伏羲 | Decoder | Paper | - | ||
Chinese-LLaMA-33B | 33B | 2023-04 | 中文 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。 | ||
Chinese-LLaMA-13B | 13B | 2023-04 | 中文 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。 | ||
Chinese-LLaMA-7B | 7B | 2023-04 | 中文 | ckpt | Linly | 深圳大学计算机视觉研究所 | Decoder | Blog | LLaMA 原始模型权重基于 GNU General Public License v3.0 协议,仅供研究使用,不能用于商业目的。 | ||
OpenChineseLLaMA | 7B | 2023-04 | 中英 | ckpt | OpenChineseLLaMA | OpenLMLab | Decoder | Non-commercial bespoke license | |||
MOSS-003 | 16B | 2023-04 | 中英 | ckpt | MOSS | 复旦大学 | Decoder | 本项目所含代码采用Apache 2.0协议,数据采用CC BY-NC 4.0协议,模型权重采用GNU AGPL 3.0协议。如需将本项目所含模型用于商业用途或公开部署,请签署本文件并填写此问卷取得授权,商用情况仅用于记录,不会收取任何费用。 | |||
BBT-2-13B-Text | 13B | 2023-04 | 中文 | 申请下载 | BBT-FinCUGE-Applications | 超对称 | Decoder | Paper | 未记述许可内容 | ||
BBT-2-12B-Text | 12B | 2023-04 | 中文 | 申请下载 | BBT-FinCUGE-Applications | 超对称 | Decoder | Paper | 未记述许可内容 | ||
Chinese-LLaMA-13B | 13B | 2023-04 | 中英 | ckpt | Chinese-LLaMA-Alpaca | Yiming Cui | Decoder | Facebook官方发布的LLaMA模型禁止商用,并且官方没有正式开源模型权重(虽然网上已经有很多第三方的下载地址)。为了遵循相应的许可,目前暂时无法发布完整的模型权重,敬请各位理解(目前国外也是一样)。Facebook完全开放模型权重之后,本项目会及时更新相关策略。这里发布的是LoRA权重,可以理解为原LLaMA模型上的一个“补丁”,两者进行合并即可获得完整版权重。以下中文LLaMA/Alpaca LoRA模型无法单独使用,需要搭配原版LLaMA模型。 | |||
flan-ul2 | 20B | 2023-03 | 多语 | ckpt | ul2 | encoder-decoder | Paper | 未记述许可内容 | |||
CPM-Bee | 10B | 2023-01 | 中英 | ckpt-10B ckpt-5B | CPM-Live | OpenBMB | Decoder | 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力! | |||
BLOOM | 176B | 2022-11 | 多语 | ckpt-95000 | Megatron-DeepSpeed | BigScience | Decoder | Paper | The BigScience RAIL License | ||
BLOOMZ | 176B | 2022-11 | 多语 | ckpt-498 | Megatron-DeepSpeed | BigScience | Decoder | Paper | The BigScience RAIL License | ||
flan-t5-xxl | 11B | 2022-11 | 多语 | ckpt | t5x | encoder-decoder | paper | Apache-2.0 license | |||
CPM-Ant+ | 10B | 2022-10 | 中英 | ckpt | CPM-Live | OpenBMB | Decoder | blog | 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力! | ||
GLM | 130B | 2022-10 | 中英 | 申请下载 | GLM-130B | 清华大学 | Decoder | paper | You will not use, copy, modify, merge, publish, distribute, reproduce, or create derivative works of the Software, in whole or in part, for any commercial, military, or illegal purposes. | ||
CPM-Ant | 10B | 2022-09 | 中文 | ckpt | CPM-Live | OpenBMB | Decoder | blog | 模型训练完成后,你可以在开放使用许可下自由下载模型参数。CPM-Live使用的是包括商业化许可的开放许可。通过模型压缩和推理加速工具,你可以在自己的电脑上体验大模型的威力! | ||
GLM | 10B | 2022-09 | 中文 | ckpt | GLM | 清华大学 | Decoder</ |