书生·浦语大模型实战营笔记(第一天)

本文探讨了大模型的发展历程,从早期的专用模型到现在的通用模型,如ChatGPT,介绍了书生·浦语系列提供的不同规模模型以及全链条开源体系,包括数据、预训练、微调的轻量化方法和部署解决方案。同时,也关注了大模型的局限性和相应的解决方案,如Lagent和AgentLego。
摘要由CSDN通过智能技术生成

发展历程

大模型的发展历程是一个由专用到通用的过程。开始的时候,专用大模型:只能针对特定任务,一个模型解决一个问题。(CNN、LFW..)到现在的通用大模型:一个模型应对多种任务、多种模态。 (ChatGPT)

书生·浦语大模型系列

书生·浦语大模型系列提供了轻量级、中量级和重量级三种模型。分别给不同的需求提供了工具。

并且体量更加轻量化。

全链条开源开放体系

全链条开源开放体系包含数据、预训练、微调、部署、评测和应用

书生·万卷提供了海量的多模态数据。预训练具有高可扩展、极致性能优化、兼容主流和开箱即用等优势。微调:增量续训和有监督微调。高效微调框架XTuner。

微调对硬件要求相对不高

8GB显存就可微调

自有评测平台

部署

部署的挑战

LMDeploy提供了大模型在GPU上部署的全流程解决方案,包括模型的量化、推理和服务。

大模型的局限性

Lagent和AgentLego来解决大模型的局限性,使大模型能有更丰富的功能。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值