书生浦语大模型学习笔记——开源生态简介

最新推荐文章于 2025-04-24 18:34:45 发布

yi柯柯

最新推荐文章于 2025-04-24 18:34:45 发布

阅读量1.1k

点赞数 20

文章标签：学习笔记

本文链接：https://blog.csdn.net/weixin_50256876/article/details/135431330

版权

书生浦语大模型是书生集团推出的预训练语言模型，具有强大的语义理解和文本生成能力。7B和20B版本开源，提供全链条工具体系，特别强调了20B模型的高性能、工具调用能力和安全性。模型应用广泛，覆盖智能客服、内容创作等领域。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

书生浦语大模型是由书生集团推出的一款大型预训练语言模型。该模型基于自然语言处理技术，能够理解和生成人类语言，具有强大的语义理解能力和文本生成能力。

书生·浦语(InternLM)大语言模型由上海人工智能实验室联合多家机构共同推出。今年6月，InternLM千亿参数(104B)语言大模型首次发布，现已经历多轮升级；7月，上海人工智能实验室开源书生·浦语70亿参数的轻量级版本InternLM-7B，且在业内率先开源贯穿数据、预训练、微调、部署和评测的全链条工具体系。InternLM-7B也已上线魔搭社区。
在这里插入图片描述

InternLM-20B是一款中量级大模型，性能先进且应用便捷，模型基于2.3T Tokens预训练语料从头训练，相较于InternLM-7B，其理解能力、推理能力、数学能力、编程能力等都有显著提升。

相比于此前国内开源的7B和13B规格模型，20B量级模型具备更强大的综合能力，复杂推理和反思能力尤为突出，能为实际应用场景提供更有力的性能支持；同时，20B量级模型可在单卡上进行推理，经过低比特量化后，可运行在单块消费级GPU上，因而在实际应用中更为便捷。
在这里插入图片描述

相比于此前的开源模型，InternLM-20B拥有几大优势：
　　一、优异的综合性能。不仅全面领先相近量级的开源模型，且以不足1/3的参数量，测评成绩达到了Llama2-70B的水平。
　　二、强大的工具调用能力。支持数十类插件，上万个API功能，还具备代码解释和反思修正能力，为智能体(Agent)的构建提供了良好的技术基础。
　　三、更长的语境。实现了对长文理解、长文生成和超长对话的有效支持，同时支持 16K 语境长度。四、更安全的价值对齐。在研发训练的过程中，研究团队进行了基于SFT和RLHF两阶段价值对齐，并通过专家红队的对抗训练大幅提高其安全性。
在这里插入图片描述

书生·浦语开源工具链也已全新升级，形成更完善的体系，包括预训练框架InternLM-Train、低成本微调框架XTuner、部署推理框架 LMDeploy、评测框架OpenCompass 以及面向场景应用的智能体框架Lagent。书生·浦语工具链将和开源数据平台OpenDataLab构成强大的开源工具及数据体系，为业界提供全链条研发与应用支持。
在这里插入图片描述