分类
专用模型--针对特定任务,一个模型解决一个问题
通用模型--一个模型针对多个任务
书生·浦语大模型介绍
轻量级、中量级、重量级
从模型到应用
全开源体系流程
- 数据--来源书生·万卷
- 预训练--使用internLM-train框架
- 微调--使用Xtuner框架
- 部署--使用LMDeploy
- 评测--使用OpenCompass
- 应用--使用Lagent/AgentLego
大语言模型特点
- 内存开销巨大
- 动态shape
- 模型结构相对简单
大语言模型局限性
- 最新信息和知识的获取
- 回复的可靠性
- 数学计算
- 工具使用和交互
部署技术挑战
- 设备
- 推理
- 服务