国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布100亿参数规模的开源可商用大语言模型CPM-Bee

沧海之巅

于 2023-07-04 21:42:41 发布

阅读量240

点赞数

分类专栏： GPT 管理体系大语言模型文章标签：自然语言处理语言模型人工智能

沧海之巅

本文链接：https://blog.csdn.net/linjie_830914/article/details/131543806

版权

管理体系同时被 3 个专栏收录

72 篇文章 40 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

大语言模型

40 篇文章 0 订阅

订阅专栏

31 篇文章 2 订阅

订阅专栏

清华大学NLP实验室和智源研究院合作的OpenBMB发布了开源大语言模型CPM-Bee，拥有100亿参数，支持中英文。在ZeroCLUE评测中，CPM-Bee仅次于人类，英文测试表现与LLaMA-13B相当。模型训练成本85万，推理资源需求较低，100亿参数仅需20GB显存。CPM-Bee的开源协议允许获得授权后商用。

摘要由CSDN通过智能技术生成

5月27日，OpenBMB发布了一个最高有100亿参数规模的开源大语言模型CPM-BEE，OpenBMB是清华大学NLP实验室联合智源研究院成立的一个开源组织。该模型针对高质量中文数据集做了训练优化，支持中英文。根据官方的测试结果，其英文测试水平约等于LLaMA-13B，中文ZeroCLUE评测结果仅次于人类水平。

开源地址：OpenBMB/CPM-Bee: 百亿参数的中英文双语基座大模型 (github.com)

此前，国产开源大语言模型最强的应该是ChatGLM-6B（https://www.datalearner.com/ai-models/pretrained-models/ChatGLM-6B ），这也是清华大学研究成果，是清华大学KEG小组发布的，在国内外都有很好的反响，截止5月26日，ChatGLM-6B 全球下载达到200万。相比较ChatGLM-6B，CPM-Bee的主要特点如下：

开源协议更加友好，只要获取书面授权即可商用。代码、预训练结果均开源，训练过程也是全球直播。
从评测结果看，CPM-Bee模型效果也很优秀，中文ZeroCLUE评测中远超其它模型，仅次于人类，英文多个任务评测结果也与LLaMA-13B差不多，部分任务上的表现超越GPT-3。
推理成本与ChatGLM-6B差不多，最低10亿参数规模的模型仅需要4.1GB显存可做推理，而100亿参数规模的推理仅需20GB显卡，单张消

了解本专栏

超级会员免费看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布100亿参数规模的开源可商用大语言模型CPM-Bee

CPM全称Chinese Pretrained Model，Bee是该系列模型的第二个里程碑版本。CPM-Bee模型是基于CPM-Ant模型继续训练得到。后者是2022年5月到9月训练的大语言模型。而CPM-Bee则是从2022年10月13日开启训练，相比之前，模型在很多任务上做了优化，包括文字填空、文本生成、问答等。这是一个基于transformer架构的自回归模型，在高质量的中英文数据集上训练了半年左右的时间。包含4个系列的预训练结果，参数分别是10亿、20亿、50亿和100亿。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

沧海之巅 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。