书生·浦语大模型全链路开源体系

狗狗熊学AI

于 2024-04-01 11:30:47 发布

阅读量397

点赞数 3

分类专栏：书生浦语实战营二期笔记文章标签：人工智能

本文链接：https://blog.csdn.net/m0_55764641/article/details/137225483

版权

1 篇文章 0 订阅

订阅专栏

本文介绍了书生·浦语的大模型体系InternLM2，包括不同规格的7B和20B模型，以及它们在性能、对话交互等方面的增强。文章强调了InternLM2回归语言本质，通过多维度数据提升和针对性补充，使其综合性能达到领先水平。

摘要由CSDN通过智能技术生成

相较于第一期实战营的本节课程内容，本次课程主要新增了对书生·浦语 2.0（InternLM2）的介绍。

InternLM2 模型体系

面对不同的使用需求，发布了 7B 和 20B 两种规格的模型，而每种规格又包含 3 种模型版本。

两种规格
7B：为轻量级的研究和应用提供了一个轻便但性能不俗的模型
20B：模型的综合性能更为强劲，可有效支持更加复杂的实用场景
三种版本
InternLM2-Base：高质量和具有很强可塑性的模型基座是模型进行深度领域适配的高质量起点
InternLM2：在 Base 基础上，在多个能力方向进行了强化，在评测中成绩优异，同时保持了很好的通用语言能力，是我们推荐的在大部分应用中考虑选用的优秀基座
InternLM2-Chat：在 Base 基础上，经过 SFT 和 RLHF，面向对话交互进行了优化，具有很好的指令遵循、共情聊天和调用工具等的能力

相较于 InternLM，InternLM2 回归语言建模的本质，在数据上下了更多的功夫：