概述:
本课程主要介绍了书生葡语大模型全链路开源体系。首先,强调了大模型作为发展人工通用人工智能的重要途径,近年来应用越来越广泛。上海人工智能实验室在大型语言模型研究方面有显著投入和成果。
书生葡语大模型的全链路开源体系包括从数据到预训练、微调、部署、评测到应用的完整环节。他们开源了多模态语料库“书生问卷”,以及预训练框架“interim train”、微调框架“extera”、部署工具“m deploy”和评测工具“open Compass”。此外,还开源了两个应用项目:“legend”和“agent Lego”。
在微调方面,介绍了增量续讯和有间度微调两种常用方法。在评测方面,开源了全球领先的评测体系open Compass,提供六大维度和超过80个数据集以及40多万道评测题目。在部署方面,开源了高效的推理框架m deploy,能够提供全流程的解决方案。
总体来看,这段文本详细介绍了大语言模型在微调、评测和部署等方面的技术和工具。通过智能体框架legend和工具箱agent Lego的结合,可以简单地将大语言模型与环境连接起来,并调用更多工具完成任务。
关键词:
1. 大模型的重要性
- 发展人工通用人工智能的途径
- 从专用模型到通用模型的发展过程
2. 大模型的应用
- 智能客服
- 个人助手
- 行业应用(如书生葡语等)
3. 大模型应用的挑战
- 业务场景复杂性
- 算力资源限制
- 与环境的交互需求
4. 大模型应用的流程
- 模型选型
- 评估业务场景复杂度
- 模型微调
- 构建智能体(如有必要)
- 试用模型并进行调整
- 评测和部署
5. 书生葡语全链条开源开放体系
- 数据:多模态语料库(书生问卷)、开放数据平台(Open Data Lab)
- 预训练:Interim Train框架
- 微调:Extera框架
- 部署:m Deploy工具
- 评测:Open Compass评测体系
- 应用:Legend项目(轻量级智能体搭建)、Agent Lego项目(大模型调用工具箱)