书生·浦语大模型全链路笔记

最新推荐文章于 2024-07-08 13:09:27 发布

山山归川

最新推荐文章于 2024-07-08 13:09:27 发布

阅读量338

点赞数 3

文章标签：笔记

本文链接：https://blog.csdn.net/weixin_45905098/article/details/139388110

版权

在这里插入图片描述

在这里插入图片描述

面向不同需求，包含2种规格，每个规格包含3个模型版本.

InternLM2-Base：高质量、强可塑性模型基座

InternLM2：在Base基础上，在多个能力方向上进行了强化，推荐作为基座

InternLM2-Chat：经过SFT和RLHF，良好的指令遵循、共情聊天和调用工具能力

XTuner，一站式解决繁琐的步骤，包括：

支持多种任务（增量预训练, 指令微调）
支持多种输入数据的格式
支持优化加速（Flash Attention, DeepSpeed）
支持多种微调算法（LoRA, QLoRA, 全量微调）

OpenCompass 2.0
司南

轻量智能体框架 Lagent
git链接

InternLM2在六个维度和30个基准测试中超越了先前的模型

主要贡献

Open-Sourcing InternLM2 with Exceptional Performance: InternLM2 的多个版本，包括 1.8B、7B 和 20B，在主观和客观评估中都表现出色。此外，还发布了不同阶段的模型，以方便社区分析 SFT 和 RLHF 训练后的变化。
Designed with a 200k Context Window: InternLM2 在长上下文方面表现出色，在 200k 上下文的“Needle-in-a-Haystack”实验中，几乎完美地“大海捞针”。
Comprehensive Data Preparation Guidance: 详细介绍了为 LLM 准备数据的过程，包括预训练数据、领域增强数据、SFT 数据和 RLHF 数据。这些细节将有助于社区更好地训练 LLM。
Innovative RLHF Training Techniques: 引入了条件在线 RLHF（COOL RLHF）来协调各种偏好，显著提高了 InternLM2 在各种主观对话评估中的性能。还对 RLHF 的主观和客观结果进行了初步分析和比较，为社区提供了见解。

在这里插入图片描述

在这里插入图片描述

在多个基准测试中达到或接近最优水平，如在AlpacaEval、MTBench、CompassArena等数据集上表现出色。

视频链接：bilibili
InternLM2 技术报告：git链接

关注