书生·浦语大模型全链路开源体系学习笔记

最新推荐文章于 2024-08-06 19:03:47 发布

到di有冇

最新推荐文章于 2024-08-06 19:03:47 发布

阅读量827

点赞数 18

分类专栏：大模型学习文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45607888/article/details/135384017

版权

大模型学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文介绍了书生浦语大模型的发展概况，其在参数量小的情况下表现出强大的性能。文章详细阐述了从大模型到应用的流程，包括选择模型、微调策略、评测体系、部署框架以及智能体的构建，展示了书生浦语的全链条开源开放体系。

摘要由CSDN通过智能技术生成

视频课程链接：https://www.bilibili.com/video/BV1Rc411b7ns/

1.书生浦语大模型概述

大模型持续走热，原因：大模型是发展通用人工智能的重要途径

在这里插入图片描述

书生浦语开源历程

在这里插入图片描述

书生浦语大模型系列

在这里插入图片描述
书生浦语20B领先相近量级开源模型(包括Llama-33BLlama2-13B以及国内主流的7B、13B开源模型)，并以不足三分之一的参数量，达到Llama2-70B水平

2.从模型到应用

在这里插入图片描述
从大模型到应用之间需要借助一些框架协助完成这些工作

2.1从模型到应用流程：

1.首先从开源社区根据不同开源模型在各个维度上的能力选择中意的大模型

2.根据应用场景来判断是否需要对大模型进行参数微调，例如，仅仅是通用的简单对话任务则可以直接使用（至步骤5），如果应用场景比较复杂则需要对模型进行微调。

3.微调：如果算力足够则可以进行续训或全参微调，如果算力有限则可以固定一部分参数，只对部分参数修改进行部分参数微调(例如：LoRA算法)

4.微调后，如果业务场景需要与外部环境交互，例如：调用外部API，或与已有数据库进行交互，则需要构建基于大模型的智能体，如果不需要则可以在业务场景进行试用

5.评测大模型是否符合应用要求，如果符合应用要求则可以进行模型部署，否则则需要重新对模型进行微调，模型部署时也要解决一些问题，例如：以更少的资源部署模型、提升应用吞吐量

在这里插入图片描述

2.2书生浦语全链条开源开放体系

在这里插入图片描述

2.2.1数据

书生万卷开放数据：

在这里插入图片描述

OpenDataLab 开放数据平台，提供很多数据

在这里插入图片描述

2.2.2 预训练

在这里插入图片描述

2.2.3 微调

大语言模型的下游应用中，增量续训和有监督微调是经常会用到两种方式

增量续训使用场景: 让基座模型学习到一些新知识，如某个垂类领域知识训练数据:文章、书籍、代码等

有监督微调使用场景:让模型学会理解和遵循各种指令，或者注入少量领域知识训练数据:高质量的对话、问答数据

在这里插入图片描述

XTuner微调框架：8G显存即可微调7B模型

在这里插入图片描述

2.2.4 评测

国内外评测体系的整体态势：

在这里插入图片描述

OpenCompass评测体系

在这里插入图片描述

OpenCompass开源评测平台架构，亮点：

丰富模型支持：开源模型、API模型一站式评测
分布式高效评测：支持千亿参数模型在海量数据集上分布式评测
便捷的数据集接口：支持社区用户根据自身需求快速添加自定义数据集
敏捷的能力迭代：每周更新大模型能力版单,每月提升评测工具能力

在这里插入图片描述

2.2.5 部署

在这里插入图片描述

为了解决上面大模型的调整，开源了LMDeploy高效的推理框架，LMDeploy 提供大模型在GPU上部署的全流程解决方案，包括模型轻量化、推理和服务。

在这里插入图片描述

LMDeploy的静态推理性能（固定batch，输入\输出token数量）和动态推理性能（真实对话，不定长的输入\输出）相对其他框架都有一定优势

2.2.6 智能体

大语言模型的局限性：最新信息和知识的获取、回复的可靠性、数学计算、工具使用和交互。基于这些需求需要让大模型驱动一个智能体，智能体通常以大模型作为核心，来进行一些规划、推理、执行（让大模型自主调用工具）

在这里插入图片描述

开源轻量级智能体框架Lagent

在这里插入图片描述

举例：1.调用python代码解释器求解数学题，2.多模态AI工具使用

在这里插入图片描述

多模态智能体工具箱AgentLego，聚焦在提供给大模型更多的工具集合，在AgentLego加持下，可以更加简单的将大模型与环境连接起来

在这里插入图片描述

关注

18
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
书生·浦语大模型全链路开源体系学习笔记

大模型持续走热，原因：大模型是发展通用人工智能的重要途径书生浦语开源历程书生浦语大模型系列书生浦语20B领先相近量级开源模型(包括Llama-33BLlama2-13B以及国内主流的7B、13B开源模型)，并以不足三分之一的参数量，达到Llama2-70B水平。
复制链接

扫一扫

专栏目录

到di有冇 CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

38万+: 周排名

15万+: 总排名

1万+: 访问

: 等级

353: 积分

213: 粉丝

191: 获赞

19: 评论

277: 收藏

私信

关注

热门文章

分类专栏

最新评论

李宏毅自注意力机制(self-attention)和Transformer详解笔记
到di有冇: 如果发现错误，欢迎大家留言，我将在第一时间修改
OpenCompass 大模型评测笔记
CSDN-Ada助手: 恭喜您撰写第17篇博客！标题“OpenCompass 大模型评测笔记”引人入胜。您的持续创作令人印象深刻，对于OpenCompass大模型的评测笔记，我深感兴趣。下一步，或许您可以考虑探索更多与大模型相关的话题，比如优化策略、实验结果的解读等等。谦虚的语气和独特的观点将使您的博客更加引人注目。期待您的下一篇博文！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。