1、时间线
-
2023年开放7B模型免费商用
-
2024年开源internLM2.5
2、能力评估指标
-
推理能力
-
长文理解、精确处理,使用大海捞针实验,7B模型已可以实现百万级token的长文理解
-
自主规划和搜索(mindSearch)
3、核心技术
模型能力飞轮
用当前模型进行辅助数据、指令优化,用于预训练数据和对齐数据,得到更好模型。随后这个更好模型又进行辅助优化,加速自身迭代。
高质量合成数据
- 基于规则的数据构造
- 基于模型的数据扩充
- 基于反馈的数据生成
4、全链条开源
-
数据 :书生·万卷,多媒体语料库
-
预训练:InternEvo,性能超过DeepSpeed,显存、分布式优化。降低硬件要求
-
微调:XTuner,微调和偏好对齐算法。在消费级设备上,1.8B模型也无法全参数微调
-
部署:LMDeploy,性能超过vllm
-
评测:OpenCompass
-
应用
-
MindSearch 思索式搜索应用
-
Lagent 支持代码解释器的智能体框架
-
-
MinerU 文档解析
-
茴香豆HuiXiangDou 基于专业知识库的群聊助手