书生·浦语大模型全链条——浅显理解

1、时间线

  • 2023年开放7B模型免费商用

  • 2024年开源internLM2.5

2、能力评估指标

  • 推理能力
    在这里插入图片描述

  • 长文理解、精确处理,使用大海捞针实验,7B模型已可以实现百万级token的长文理解

  • 自主规划和搜索(mindSearch)

3、核心技术

模型能力飞轮

用当前模型进行辅助数据、指令优化,用于预训练数据和对齐数据,得到更好模型。随后这个更好模型又进行辅助优化,加速自身迭代。

高质量合成数据

  • 基于规则的数据构造
  • 基于模型的数据扩充
  • 基于反馈的数据生成

4、全链条开源

  • 数据 :书生·万卷,多媒体语料库
    在这里插入图片描述

  • 预训练:InternEvo,性能超过DeepSpeed,显存、分布式优化。降低硬件要求

    在这里插入图片描述

  • 微调:XTuner,微调和偏好对齐算法。在消费级设备上,1.8B模型也无法全参数微调

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 部署:LMDeploy,性能超过vllm

在这里插入图片描述
在这里插入图片描述

  • 评测:OpenCompass

    在这里插入图片描述

  • 应用

    • MindSearch 思索式搜索应用

      在这里插入图片描述

    • Lagent 支持代码解释器的智能体框架

在这里插入图片描述
在这里插入图片描述

  • MinerU 文档解析

  • 茴香豆HuiXiangDou 基于专业知识库的群聊助手
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值