书生·浦语实战营第二期

小马加油干

已于 2024-03-31 12:35:06 修改

阅读量1.1k

点赞数 38

文章标签：人工智能

于 2024-03-31 12:30:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44001574/article/details/137196565

版权

书生·浦语实战营第二期

第一课书生·浦语大模型全链路开源体系

第一课为视频课主要介绍了大模型、书生·浦语大模型的发展，从基础模型到实际应用的主要步骤，以及书生·浦语全链条开源开放体系等。

1、发展历程

在过去，人工智能领域的发展一直遵循着一个基本原则：一个模型对应一个场景或者任务。然而，随着技术的进步和需求的增长，这一格局正在发生深刻的变化。如今，我们正迈向一个新的时代，一个模型不再局限于一个场景或任务，而是可以应用于多个场景、多模态的复杂环境中。

书生·浦语大模型的发展历程彰显了这一变革的重要性。它从轻量级的7B社区模型，逐步升级到中量级的20B商业模型，再到重量级的123B全场景模型。这一演进不仅仅是在模型规模上的提升，更是对多模态、多场景应用需求的积极响应。

在这里插入图片描述

2、从模型到应用

在这里插入图片描述

第一步：模型选型

在应用场景中，根据多个大模型的相关维度进行能力比较，并进行模型评测。初步选型后，可确定意向大模型。

第二步：评估业务场景复杂度

业务场景简单： 如果业务场景不太复杂，可以直接将选定的模型应用于场景中。

业务场景复杂： 对于复杂场景，通常直接使用开源模型难以满足需求，需要进一步微调、进行prompt工程等构建工作。

第三步：判断微调策略

全参数微调： 若算力足够，可以进行全参数微调，提高模型性能。

部分参数微调： 如果算力受限，只能进行部分参数微调，固定大部分参数，调整一小部分参数。

第四步：构建智能体

模型与环境交互： 考虑模型与环境的交互，特别是如果需要调用外部API或与已有业务数据库交互，则需要构建智能体。

无环境交互： 如果模型在业务场景中不需要与环境进行交互，可以直接将微调好的模型应用于场景。

第五步：模型评测与应用上线

模型评测： 进行模型评测，确保在实际场景中表现良好。

上线或迭代： 根据评测结果，决定是否上线应用或者继续迭代模型。

第六步：模型部署

考虑软件系统相关性能、安全、功能等方面内容：

资源优化： 考虑如何以更少的资源部署模型。

吞吐量提升： 提升整个应用的吞吐量，确保在生产环境中的性能表现。

这六个步骤构成了从选择模型到应用部署的全链条，确保在实际应用中大模型能够充分发挥作用。

3、书生·浦语大模型全链路开源体系

书生·浦语大模型打破了传统的人工智能应用模式，提出了全链条开源开放体系。这一体系涵盖了从数据到预训练、微调、部署、评测到应用的全过程，为通用人工智能的实现提供了完整的解决方案。数据（书生·万卷）作为起点，经过IntermLM-Train的预训练，使用XTuner进行微调，通过LMDeploy实现部署，通过OpenCompass进行全面评测，最终应用在Lagent构建的多模态智能体中。
在这里插入图片描述

这一全链条开源开放体系，为大模型的发展提供了创新性的方法，促使人工智能更好地服务于多样化的现实需求。

数据：覆盖多模态和任务

全链条开源体系以书生-万卷为基础，涵盖了多模态和多任务的数据需求，为模型的学习提供了全面支持。

OpenDataLab：开放数据平台

OpenDataLab作为开放数据平台，不仅包含丰富多样的开放数据，还为大模型的发展提供了数据支持和实验平台。

预训练：并行训练，极致优化

InterLM采用并行训练的方式，通过极致优化实现了高效的预训练，为模型的通用性奠定基础。

微调：XTuner，支持全参数微调，支持Lora等低成本微调

微调阶段使用XTuner工具，支持全参数微调，同时还支持诸如Lora等低成本微调方法，使模型更好地适应各种特定任务。

特性：

增量续训：让基座模型学习新知识，垂直领域
有监督微调：让模型学会理解和遵循各种指令。一般采用全量参数微调和部分参数微调等方法。
多种微调算法：多种微调策略与算法，覆盖各类SFT场景。
适配多种开源生态：支持加载HuggingFace、ModelScope模型或者数据级
自动优化加速：开发者无需关注复杂的显存优化和计算加速细节

部署：LMDeploy，全链路部署，性能领先

LMDeploy提供了全链路部署的解决方案，包括模型轻量化、推理和服务，使得大模型在GPU上的部署更加高效，性能领先。

评测：OpenCompass，全方位评测，性能可以复现，全球领先的大模型开源评测体系

评测阶段使用OpenCompass工具，全方位评测模型性能，保证了评测结果的复现性，成为全球领先的大模型开源评测体系。

特性：

丰富模型支持：开源模型、API模型一站式评测。
分布式高效评测：支持千亿参数模型在海量数据集上分布式评测。
便捷的数据集接口：支持社区用户根据自身需求快速添加自定义数据集。
敏捷的能力迭代：每周更新大模型能力榜单。

应用：Legent、AgentLego 支持多种智能体，支持代码解释器和多种工具

最终，模型的应用在Legent和AgentLego等多种智能体中得以体现，支持代码解释器和多种工具，实现了多模态智能体的灵活应用。

特性：

丰富的工具集合，尤其是提供了大量视觉、多模态相关领域的工具。
支持多个主流智能体系统，如LangChain、Transformers Agent、Lagent等。
灵活的多模态工具调用接口，可以轻松支持各类输入输出格式的工具函数
一键式远程工具部署，轻松使用和调试大模型智能体

小马加油干

关注

38
点赞
踩
48

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语实战营第二期

第一课为视频课主要介绍了大模型、书生·浦语大模型的发展，从基础模型到实际应用的主要步骤，以及书生·浦语全链条开源开放体系等。
复制链接

扫一扫

小马加油干 CSDN认证博客专家 CSDN认证企业博客

码龄6年

6: 原创

115万+: 周排名

8万+: 总排名

4707: 访问

: 等级

210: 积分

104: 粉丝

145: 获赞

1: 评论

143: 收藏

私信

关注

热门文章

分类专栏

书生浦语训练营 3篇

最新评论

书生·浦语实战营第二期
CSDN-Ada助手: 恭喜您撰写了第三篇博客“书生·浦语实战营第二期”，持续创作是非常了不起的事情，让我们能够不断学习和进步。希望您能够继续保持这样的创作热情，勇敢地分享自己的见解和经验。或许在下一篇博客中，可以尝试探讨一些更深入的话题，或者结合实际案例展开讨论，让读者有更多启发和思考。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Transformer模型详解
CSDN-Ada助手: 非常感谢您分享关于Transformer模型的详细解析！您对于这一主流框架的深入理解令人钦佩。您的博客文章不仅激发了读者的学习兴趣，还为他们提供了理解当前大语言模型技术架构的基础知识。除了您在标题和摘要中提到的内容，我想补充一些与Transformer模型相关的扩展知识和技能。首先，对于NLP领域的研究者和从业者来说，了解与Transformer密切相关的注意力机制是非常重要的。此外，掌握Transformer模型的训练和调优技巧也是进一步提升模型性能的关键。此外，对于想要进一步深入研究的人来说，可以了解Transformer模型在其他领域的应用，如图像生成和音频处理等。再次感谢您的分享，期待您未来更多关于Transformer模型以及相关技术的深入探讨！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。