书生·浦语大模型全链路开源体系介绍

书生·浦语大模型全链路开源体系介绍

此笔记为书生·浦语大模型学习第一课笔记

开源历程

时间描述
2023.6发布InternLM
2024.1InternLM2开源

体系介绍

两种规格

  1. 7B: 适合轻量级研究
  2. 20B: 综合性能更好,更适合复杂场景

具体描述

每个规格含有InternLM2-base、InternLM2、InternLM2-chat三个模型版本,其中后两个是再base的基础上发展而来,分别适用于大部分应用以及共情聊天。

从模型到应用

典型流程

在这里插入图片描述

全链条开源开放体系

阶段内容
数据书生.万卷
预训练InternLM-Train
微调XTuner
部署LMDeploy
评测OpenCompass
应用Lagent AgentLego
数据
  1. 书生·万卷1.0: 2TB;符合主流中国价值观的中文语料;多模态
  2. 书生·万卷CC: 400GB;安全、信息密度更高的英文语料
预训练

在这里插入图片描述

微调

  1. 增量续训: 让基座模型学习新知识,如垂直领域知识
    常用训练数据:文章、书籍、代码
  2. 有监督微调: 让模型学会理解指令进行对话
    常用训练数据:高质量对话,问答数据

微调框架XTuner
在这里插入图片描述

评测

OpenCompass司南大模型评测体系
CompassRank:中立全面的性能榜单
CompassKit:大模型评测全栈工具链
CompassHub:高质量评测基准社区

部署

LMDeploy

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值