书生浦语大模型实战营第三期笔记 书生浦语大模型全链路开源开放体系

书生大模型性能天梯图

书生·浦语2.5

  • 原生推理能力领先
  • 支持百万字上下文
  • 通过信息搜索和整合,完成复杂任务
    • MindSearch

核心技术思路

数据驱动模型性能提升

当前模型 -> 数据过滤,智能评估 -> 预训练数据 -> 更好模型

当前模型 -> 指令生成,辅助标注 -> 对齐数据 -> 更好模型

高质量合成数据
  • 基于规则的数据构造
    • 代码
    • 公式、函数
    • 数学题解
  • 基于模型的数据扩充
  • 基于反馈的数据生成
  • 有open datalab,lable llm的开源项目,可以对nlp任务进行标注

 

全链路开源

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值