书生·浦语实战营第二期

书生·浦语实战营第二期

第一课 书生·浦语大模型全链路开源体系

第一课为视频课主要介绍了大模型、书生·浦语大模型的发展,从基础模型到实际应用的主要步骤,以及书生·浦语全链条开源开放体系等。

1、发展历程

在过去,人工智能领域的发展一直遵循着一个基本原则:一个模型对应一个场景或者任务。然而,随着技术的进步和需求的增长,这一格局正在发生深刻的变化。如今,我们正迈向一个新的时代,一个模型不再局限于一个场景或任务,而是可以应用于多个场景、多模态的复杂环境中。

书生·浦语大模型的发展历程彰显了这一变革的重要性。它从轻量级的7B社区模型,逐步升级到中量级的20B商业模型,再到重量级的123B全场景模型。这一演进不仅仅是在模型规模上的提升,更是对多模态、多场景应用需求的积极响应。

在这里插入图片描述

2、从模型到应用

在这里插入图片描述

第一步:模型选型

在应用场景中,根据多个大模型的相关维度进行能力比较,并进行模型评测。初步选型后,可确定意向大模型。

第二步:评估业务场景复杂度

业务场景简单: 如果业务场景不太复杂,可以直接将选定的模型应用于场景中。

业务场景复杂: 对于复杂场景,通常直接使用开源模型难以满足需求,需要进一步微调、进行prompt工程等构建工作。

第三步:判断微调策略

全参数微调: 若算力足够,可以进行全参数微调,提高模型性能。

部分参数微调: 如果算力受限,只能进行部分参数微调,固定大部分参数,调整一小部分参数。

第四步:构建智能体

模型与环境交互: 考虑模型与环境的交互,特别是如果需要调用外部API或与已有业务数据库交互,则需要构建智能体。

无环境交互: 如果模型在业务场景中不需要与环境进行交互,可以直接将微调好的模型应用于场景。

第五步:模型评测与应用上线

模型评测: 进行模型评测,确保在实际场景中表现良好。

上线或迭代: 根据评测结果,决定是否上线应用或者继续迭代模型。

第六步:模型部署

考虑软件系统相关性能、安全、功能等方面内容:

资源优化: 考虑如何以更少的资源部署模型。

吞吐量提升: 提升整个应用的吞吐量,确保在生产环境中的性能表现。

这六个步骤构成了从选择模型到应用部署的全链条,确保在实际应用中大模型能够充分发挥作用。

3、书生·浦语大模型全链路开源体系

书生·浦语大模型打破了传统的人工智能应用模式,提出了全链条开源开放体系。这一体系涵盖了从数据到预训练、微调、部署、评测到应用的全过程,为通用人工智能的实现提供了完整的解决方案。数据(书生·万卷)作为起点,经过IntermLM-Train的预训练,使用XTuner进行微调,通过LMDeploy实现部署,通过OpenCompass进行全面评测,最终应用在Lagent构建的多模态智能体中。
在这里插入图片描述

这一全链条开源开放体系,为大模型的发展提供了创新性的方法,促使人工智能更好地服务于多样化的现实需求。

数据:覆盖多模态和任务

全链条开源体系以书生-万卷为基础,涵盖了多模态和多任务的数据需求,为模型的学习提供了全面支持。

OpenDataLab:开放数据平台

OpenDataLab作为开放数据平台,不仅包含丰富多样的开放数据,还为大模型的发展提供了数据支持和实验平台。

预训练:并行训练,极致优化

InterLM采用并行训练的方式,通过极致优化实现了高效的预训练,为模型的通用性奠定基础。

微调:XTuner,支持全参数微调,支持Lora等低成本微调

微调阶段使用XTuner工具,支持全参数微调,同时还支持诸如Lora等低成本微调方法,使模型更好地适应各种特定任务。

特性:

  • 增量续训:让基座模型学习新知识,垂直领域
  • 有监督微调:让模型学会理解和遵循各种指令。一般采用全量参数微调和部分参数微调等方法。
  • 多种微调算法:多种微调策略与算法,覆盖各类SFT场景。
  • 适配多种开源生态:支持加载HuggingFace、ModelScope模型或者数据级
  • 自动优化加速:开发者无需关注复杂的显存优化和计算加速细节
部署:LMDeploy,全链路部署,性能领先

LMDeploy提供了全链路部署的解决方案,包括模型轻量化、推理和服务,使得大模型在GPU上的部署更加高效,性能领先。

评测:OpenCompass,全方位评测,性能可以复现,全球领先的大模型开源评测体系

评测阶段使用OpenCompass工具,全方位评测模型性能,保证了评测结果的复现性,成为全球领先的大模型开源评测体系。

特性:

  • 丰富模型支持:开源模型、API模型一站式评测。
  • 分布式高效评测:支持千亿参数模型在海量数据集上分布式评测。
  • 便捷的数据集接口:支持社区用户根据自身需求快速添加自定义数据集。
  • 敏捷的能力迭代:每周更新大模型能力榜单。
应用:Legent、AgentLego 支持多种智能体,支持代码解释器和多种工具

最终,模型的应用在LegentAgentLego等多种智能体中得以体现,支持代码解释器和多种工具,实现了多模态智能体的灵活应用。

特性:

  • 丰富的工具集合,尤其是提供了大量视觉、多模态相关领域的工具。
  • 支持多个主流智能体系统,如LangChain、Transformers Agent、Lagent等。
  • 灵活的多模态工具调用接口,可以轻松支持各类输入输出格式的工具函数
  • 一键式远程工具部署,轻松使用和调试大模型智能体
  • 38
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值