中文开源LLM评测

最新推荐文章于 2024-05-21 22:44:12 发布

MING__X

最新推荐文章于 2024-05-21 22:44:12 发布

阅读量634

点赞数 3

分类专栏：人工智能文章标签：人工智能深度学习 langchain copilot gpt prompt embedding

本文链接：https://blog.csdn.net/m0_73051397/article/details/131333243

版权

2 篇文章 0 订阅

订阅专栏

中文开源LLM汇总评测

建议使用通用的模型推理工具包运行推理，一般都提供较好的UI以及兼容OpenAI 的API。常见的有：

其中

兼容性最好的是 text-generation-webui，支持 8bit/4bit 量化加载、GPTQ 模型加载、GGML 模型加载、Lora 权重合并、OpenAI 兼容API、Embeddings模型加载等功能，推荐！
苹果 M 系列芯片，推荐用 llama.cpp
开箱即用，选择 gpt4all，有桌面端软件。

注：如果模型参数过大无法加载，可以在 HuggingFace 上寻找其 GPTQ 4-bit 版本，或者 GGML 版本（支持Apple M系列芯片）。
目前30B规模参数模型的 GPTQ 4-bit 量化版本，可以在 24G显存的 3090/4090 显卡上单卡运行推理。

值得关注的支持中文的开源 Base 模型（同类模型中选效果最好的、参数最大的）

名称	类型	参数量	上下文	License	地址
Aquila-7B	Base	7B	2048 tokens	商用	https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-pretrain
Ziya-LLaMA-13B-Pretrain-v1	Base	13B	2048 tokens	非商用	https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-Pretrain-v1
Chinese-LLaMA-33B	Base	33B	2048 tokens	非商用	https://github.com/ymcui/Chinese-LLaMA-Alpaca
baichuan-7B	Base	7B	4096 tokens	商用（需申请）	https://github.com/baichuan-inc/baichuan-7B

不同模型的 token 对应的中文字符数不同，一般来说专门为中文设计的模型，其词表较大，相同中文字符数使用的 token 数量相比于 OpenAI （1 字符 2 token）较小，约为平均 1 字符 1 token。

值得关注的支持中文的开源 Chat 模型（同类模型中选效果最好的）

名称	类型	参数量	上下文	License	地址
BELLE-LLaMA-EXT-13B	SFT	13B	2048 tokens	非商用	https://github.com/LianjiaTech/BELLE
Chinese-Alpaca-Plus-13B	SFT	13B	2048 tokens	非商用	https://github.com/ymcui/Chinese-LLaMA-Alpaca
ChatGLM-6B	SFT	6B	2048 tokens	非商用	https://github.com/THUDM/ChatGLM-6B
Ziya-LLaMA-13B-v1.1	SFT	13B	2048 tokens	非商用	https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1.1
AquilaChat-7B	SFT	7B	2048 tokens	商用	https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-chat
WizardLM-30B-V1.0	SFT	30B	2048 tokens	非商用	https://huggingface.co/WizardLM/WizardLM-30B-V1.0