文章目录
1. 书生大模型全链路开源体系总览
从数据到预训练, 到微调, 到部署, 到评测, 到应用,实现方案, 全部开源!
书生万卷
从数据方面呢, 这个在也开源了一个预训练的语料库, 书生万卷数据集@opendatalab
针对数据标注, 开源了数据处理工具箱
- labelllm 大模型辅助标注
- MinerU 复杂文档解析工具
- Label U 轻量标注
InternEVO 预训练框架
4D并行的全面预训练框架
微调框架XTuner
LMDeploy 部署框架
OpenCompass 评测框架
应用
MindSearch大模型增强搜索引擎
Lagent 智能体框架
HuixiangDou 群聊助手RAG
InternLM 历程
发展历程
InternLM2.5 今日性能
领先的推理能力
1M token 上下文