书生大模型开源体系介绍
大模型成为目前很热的关键词,最热门的研究方向,热门的应用;ChatGPT的横空出世所引爆,快速被人们上手应用到各领域;
0 通用人工智能
相信使用过大模型实际应用的人都会相信大模型是最终发展成为通用人工智能,更类人脑的重要途径;
AI的研究方向也从专用模型逐步拓展研究到通过模型;倾向于使用一个模型应对多种任务模型和模态;
1 InternLM性能及模型
上海人工智能实验室投入研究开发,进行大语言大模型的研究工作;
- InternLM–在2023年6月7号正式发布。
- InternLM-7B开源免费商用的单元模型,并开源全链条的工具体系;
- 书生大模型系列:InternLM-7B—>InternLM-20B—>InternLM-123B;从轻量级–中量级—重量级;主要使用InternLM-20B大模型;
2 从模型到应用
从大模型到具体的应用,需要借助工具和框架来协助完成模型到应用的转换;
1.通用模型到应用的步骤图;
2.以书生大模型为例
具体介绍其书生大模型开源开放体系的上述步骤中的部署使用
解释:
- 数据方面,开源了多模态语料库书生万卷,包括2TB的数据和多种模态和任务。
- 预训练方面,开源了InternLM-Train预训练框架,通过并行优化提高训练效率。
- 微调方面,开源了XTuner框架,支持全参数微调和低成本微调。
部署方面,开源了LMDeploy 框架,支持全链路部署流程。 - 评测方面,开源了OpenCompass 评测工具,提供全方位评测能力,并提供公开的Leaderboard。
- 应用方面,开源了Lagent和AgentLego项目,提供轻量级智能体搭建框架和丰富的工具箱。