主要亮点
InternLM 2 体系
面向不同需求,包含2种规格,每个规格包含3个模型版本.
版本
InternLM2-Base:高质量、强可塑性模型基座
InternLM2:在Base基础上,在多个能力方向上进行了强化,推荐作为基座
InternLM2-Chat:经过SFT和RLHF,良好的指令遵循、共情聊天和调用工具能力
微调
XTuner,一站式解决繁琐的步骤,包括:
支持多种任务(增量预训练, 指令微调)
支持多种输入数据的格式
支持优化加速(Flash Attention, DeepSpeed)
支持多种微调算法(LoRA, QLoRA, 全量微调)
评测
OpenCompass 2.0
司南
Agent 智能体
轻量智能体框架 Lagent
git链接
LnternLM 2 技术框架
InternLM2在六个维度和30个基准测试中超越了先前的模型
主要贡献
-
Open-Sourcing InternLM2 with Exceptional Performance: InternLM2 的多个版本,包括 1.8B、7B 和 20B,在主观和客观评估中都表现出色。此外,还发布了不同阶段的模型,以方便社区分析 SFT 和 RLHF 训练后的变化。
-
Designed with a 200k Context Window: InternLM2 在长上下文方面表现出色,在 200k 上下文的“Needle-in-a-Haystack”实验中,几乎完美地“大海捞针”。
-
Comprehensive Data Preparation Guidance: 详细介绍了为 LLM 准备数据的过程,包括预训练数据、领域增强数据、SFT 数据和 RLHF 数据。这些细节将有助于社区更好地训练 LLM。
-
Innovative RLHF Training Techniques: 引入了条件在线 RLHF(COOL RLHF)来协调各种偏好,显著提高了 InternLM2 在各种主观对话评估中的性能。还对 RLHF 的主观和客观结果进行了初步分析和比较,为社区提供了见解。
数据准备
模型结构
性能评估
在多个基准测试中达到或接近最优水平,如在AlpacaEval、MTBench、CompassArena等数据集上表现出色。