发展历程
大模型的发展历程是一个由专用到通用的过程。开始的时候,专用大模型:只能针对特定任务,一个模型解决一个问题。(CNN、LFW..)到现在的通用大模型:一个模型应对多种任务、多种模态。 (ChatGPT)
书生·浦语大模型系列
书生·浦语大模型系列提供了轻量级、中量级和重量级三种模型。分别给不同的需求提供了工具。
并且体量更加轻量化。
全链条开源开放体系
全链条开源开放体系包含数据、预训练、微调、部署、评测和应用
书生·万卷提供了海量的多模态数据。预训练具有高可扩展、极致性能优化、兼容主流和开箱即用等优势。微调:增量续训和有监督微调。高效微调框架XTuner。
微调对硬件要求相对不高
8GB显存就可微调
自有评测平台
部署
部署的挑战
LMDeploy提供了大模型在GPU上部署的全流程解决方案,包括模型的量化、推理和服务。
大模型的局限性
Lagent和AgentLego来解决大模型的局限性,使大模型能有更丰富的功能。