书生·浦语大模型全链路笔记

在这里插入图片描述

主要亮点

在这里插入图片描述

InternLM 2 体系

面向不同需求,包含2种规格,每个规格包含3个模型版本.

版本

InternLM2-Base:高质量、强可塑性模型基座

InternLM2:在Base基础上,在多个能力方向上进行了强化,推荐作为基座

InternLM2-Chat:经过SFT和RLHF,良好的指令遵循、共情聊天和调用工具能力

微调

XTuner,一站式解决繁琐的步骤,包括:

支持多种任务(增量预训练, 指令微调)
支持多种输入数据的格式
支持优化加速(Flash Attention, DeepSpeed)
支持多种微调算法(LoRA, QLoRA, 全量微调)

评测

OpenCompass 2.0
司南

Agent 智能体

轻量智能体框架 Lagent
git链接

LnternLM 2 技术框架

InternLM2在六个维度和30个基准测试中超越了先前的模型

主要贡献

  1. Open-Sourcing InternLM2 with Exceptional Performance: InternLM2 的多个版本,包括 1.8B、7B 和 20B,在主观和客观评估中都表现出色。此外,还发布了不同阶段的模型,以方便社区分析 SFT 和 RLHF 训练后的变化。

  2. Designed with a 200k Context Window: InternLM2 在长上下文方面表现出色,在 200k 上下文的“Needle-in-a-Haystack”实验中,几乎完美地“大海捞针”。

  3. Comprehensive Data Preparation Guidance: 详细介绍了为 LLM 准备数据的过程,包括预训练数据、领域增强数据、SFT 数据和 RLHF 数据。这些细节将有助于社区更好地训练 LLM。

  4. Innovative RLHF Training Techniques: 引入了条件在线 RLHF(COOL RLHF)来协调各种偏好,显著提高了 InternLM2 在各种主观对话评估中的性能。还对 RLHF 的主观和客观结果进行了初步分析和比较,为社区提供了见解。

数据准备

在这里插入图片描述

模型结构

在这里插入图片描述

性能评估

在多个基准测试中达到或接近最优水平,如在AlpacaEval、MTBench、CompassArena等数据集上表现出色。

参考资料

视频链接:bilibili
InternLM2 技术报告:git链接

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值