书生 浦语2.5
推理能力领先:综合推理能力相较于InternLM2性能提升20%
支持100万字上下文
自主规划和搜索,完成复杂任务
核心技术思路:数据驱动的模型迭代更新
基于规则的数据构造、基于模型的数据扩充、基于反馈的数据生成
模型体量:
1.8B:超轻量级,可用于端侧应用或开发者快速学习上手
7B:模型轻便但性能不俗
20B:综合性能强劲,有效支持复杂场景
102B:典型场景表现接近GPT-4
开源生态总览图:
数据:书生 万卷,首个精细处理的开源多模态语料库
预训练:InterEvo,性能超过国际主流训练框架DeepSpeed
微调:XTuner 多种微调和偏好对齐算法,支持千亿参数+百万上下文
部署:LMDeploy 性能超过国际主流推理框架vllm
评测:OpenCompass,社区最全面的开源评测体系
应用:MindSearch Lagent MinerU HuiXiangDou