书生 ⋅ \cdot ⋅ 浦语大模型实战营-作业
作业一:书生·浦语大模型全链路开源体系
文章目录
大模型背景介绍
-
大模型成为热门关键词
-
大模型成为发展通用人工智能的重要途径
从专用模型到通用模型 -
书生大模型的开源历程
从模型到应用
介绍了大模型应用的流程的策略
书生 全链条开源开放体系
数据
书生万卷 数据集
- 多模态 (文、图-文、视频)
- 精细化处理
- 价值观对齐
opendata
预训练
微调
需要注意,可能在训练垂类数据时候加上基础对话数据进行配置,防止造成基础文本理解和对话能力的下降
增量续训
让基座模型学习到一些新知识,如某个垂类领域知识训练数据:文章、书籍、代码等
有监督微调
使用场景:让模型学会理解和遵循各种指令,或者注入少量领域知识
训练数据:高质量的对话、问答数据
评测
OpenCompass
部署
应用