书生·浦语大模型开源体系（一）——模型

最新推荐文章于 2024-07-09 09:58:25 发布

VertexGeek

最新推荐文章于 2024-07-09 09:58:25 发布

阅读量507

点赞数 9

分类专栏：书生·浦语大模型实战营第二期文章标签：人工智能语言模型 ai

本文链接：https://blog.csdn.net/2301_77286822/article/details/137125545

版权

7 篇文章 0 订阅

订阅专栏

这一篇笔记和之前第一期的介绍内容基本一致，需要的读者老爷，可以先看书生·浦语全链路开源开放体系，这里我们重点介绍InternLM2大模型。

IntenLM2模型开源版本分为7B和20B两种参数规模的模型：

internlm2-base: 高质量和具有很强可塑性的模型基座，是模型进行深度领域适配的高质量起点；
internlm2（推荐）: 在internlm2-base基础上，进一步在特定领域的语料上进行预训练，在评测中成绩优异，同时保持了很好的通用语言能力，是我们推荐的在大部分应用中考虑选用的优秀基座；
internlm2-chat-sft：在Base基础上，进行有监督的人类对齐训练；
internlm2-chat（推荐）：在internlm2-chat-sft基础上，经过RLHF，面向对话交互进行了优化，具有很好的指令遵循、共情聊天和调用工具等的能力。

InternLM2 的基础模型具备以下的技术特点

有效支持20万字超长上下文：模型在20万字长输入中几乎完美地实现长文“大海捞针”，而且在 LongBench 和 L-Eval 等长文任务中的表现也达到开源模型中的领先水平。
综合性能全面提升：各能力维度相比上一代模型全面进步，在推理、数学、代码等方面的能力提升显著。

评测集	InternLM2-7B	InternLM2-Chat-7B	InternLM2-20B	InternLM2-Chat-20B	ChatGPT	GPT-4
MMLU	65.8	63.7	67.7	66.5	69.1	83.0
AGIEval	49.9	47.2	53.0	50.3	39.9	55.1
BBH	65.0	61.2	72.1	68.3	70.1	86.7
GSM8K	70.8	70.7	76.1	79.6	78.2	91.4
MATH	20.2	23.0	25.5	31.9	28.0	45.8
HumanEval	43.3	59.8	48.8	67.1	73.2	74.4
MBPP(Sanitized)	51.8	51.4	63.0	65.8	78.9	79.0