第一节“书生·浦语大模型全链路开源体系”笔记

PiQiuNi

已于 2024-04-15 10:02:54 修改

阅读量524

点赞数 6

分类专栏：书生·浦语大模型实战营——笔记文章标签：开源笔记人工智能语言模型

于 2024-04-03 12:37:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PiQiuNi/article/details/137340187

版权

书生·浦语大模型实战营——笔记专栏收录该内容

13 篇文章 0 订阅

订阅专栏

书生·浦语大模型实战营——第一节“书生·浦语大模型全链路开源体系”

在这里插入图片描述

介绍

通用人工智能——不同于专用模型——针对特定任务，单模型对应单任务
大模型——具备常识性知识，可应对多领域多种任务

从模型到应用

根据实际应用需求，进行模型选择-模型训练（微调）-模型部署应用
在这里插入图片描述

全链路开源体系——万卷数据

针对语言大模型、视觉语言大模型等多模态大模型，提供不同训练数据支持：

文本数据
图像-文本数据
视频数据

为模型训练提供以下帮助：

多模态融合——涵盖科技、文学、媒体、教育和法律等多个领域。该数据集对模型的知识内容、逻辑推理和泛化能力的提升有显著效果
精细化处理——经过语言筛选、文本提取、格式标准化、数据过滤和清洗（基于规则和模型）、多尺度去重和数据质量评估等精细数据处理环节，能够很好地适应后续模型训练的要求
价值观对齐——在万卷的构建过程中，研究人员注重将数据内容与主流中国价值观进行对齐，并通过算法和人工评估的结合提高语料库的纯净度

全链路开源体系——预训练工具

高可拓展性
极致性能优化
兼容主流
开箱即用

全链路开源体系——微调

增量续训——针对垂类领域知识，通过文章、书籍、代码等，让基座模型学习到一些新知识
有监督微调——通过高质量的对话、问答数据，让模型学会理解和遵循各种指令，或者注入少量领域知识

XTuner

适配多种生态

适配多种硬件

消费级入门显卡部署
在这里插入图片描述

全链路开源体系——评测

主观评测 / 客观评测
中文评测 / 多语言评测
单学科领域评测 / 多学科多领域评测

OpenCompass

提供6大维度，80+评测集，40万+评测题目
在这里插入图片描述

全链路开源体系——部署

大模型部署

大语言模型特点

内存开销巨大
动态Shape
模型结构相对简单

技术挑战

低算力设备部署
加速推理
实时服务

部署方案

模型并行
低比特量化
Attention优化
计算与访存优化
Continous Batching

LMDeploy

提供大模型在GPU上部署的全流程解决方案，包括模型轻量化、推理和服务。
在这里插入图片描述

全链路开源体系——智能体

大语言模型存在局限性

在最新信息和知识的获取，回复的可靠性，数学计算，工具使用和交互上存在问题

引入**”智能体“——通过大模型管理**多类工具/已有应用，实现更加智能与准确的问题解决。
在这里插入图片描述

轻量级智能体框架Lagent

支持多种类型的智能体能力
灵活支持多种大语言模型
简单易拓展，支持丰富的工具

多模态智能体工具箱 AgentLego

丰富的工具集合，尤其是提供了大量视觉、多模态相关领域的前沿算法功能支持多个主流智能体系统，如 LangChain，Transformers Agent，Lagent 等灵活的多模态工具调用接口，可以轻松支持各类输入输出格式的工具函数键式远程工具部署，轻松使用和调试大模型智能体
在这里插入图片描述

总结

书生·浦语大模型全链路开源体系在数据-预训练-微调-部署-评测-应用多个维度上，为大模型的开发提供了支持，帮助开发者更方便地进行系统开发与应用部署。
在这里插入图片描述

关注

6
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
第一节“书生·浦语大模型全链路开源体系”笔记

书生·浦语大模型全链路开源体系在数据-预训练-微调-部署-评测-应用多个维度上，为大模型的开发提供了支持，帮助开发者更方便地进行系统开发与应用部署。
复制链接

扫一扫

专栏目录

PiQiuNi CSDN认证博客专家 CSDN认证企业博客

码龄12年

15: 原创

45万+: 周排名

10万+: 总排名

1万+: 访问

: 等级

264: 积分

85: 粉丝

103: 获赞

14: 评论

166: 收藏

私信

关注

热门文章

分类专栏

最新评论

第四节“XTuner 微调 LLM”作业
CSDN-Ada助手: 恭喜您撰写了第11篇博客“XTuner 微调 LLM”作业！您的持续创作展现了对知识的追求和热爱，值得称赞。在下一步的创作中，或许可以尝试深入探讨XTuner的应用场景和技术原理，以及LLM的工作原理和优势，这样能让读者更加全面地了解相关内容。期待您的更多精彩作品！祝您创作顺利，不断进步！
第四节“XTuner 微调 LLM”笔记
CSDN-Ada助手: 恭喜您撰写第12篇博客“XTuner 微调 LLM”笔记，看来您对这个主题有着深入的了解和研究。希望您能继续坚持创作，分享更多有价值的内容给读者。或许在下一篇博客中，可以探讨一些与XTuner相关的实际案例或者应用场景，让读者更好地理解和运用这项技术。期待您的下一篇作品！
第六节“Lagent & AgentLego 智能体应用搭建”作业
CSDN-Ada助手: 恭喜您在博客创作上的持续努力，第13篇博客“第六节‘Lagent & AgentLego 智能体应用搭建’作业”内容丰富有趣，让读者受益匪浅。建议您在下一篇博客中可以深入探讨智能体应用搭建的实际案例，或者分享一些应用搭建中的技巧和经验，让读者更加深入了解相关主题。期待您的精彩继续创作！
第六节“Lagent & AgentLego 智能体应用搭建”笔记
CSDN-Ada助手: 恭喜作者发布第14篇博客，标题为“第六节‘Lagent & AgentLego 智能体应用搭建’笔记”。感谢作者的分享和总结，对于智能体应用搭建的内容有了更深入的了解。希望作者能继续坚持创作，分享更多有趣、有价值的内容。建议作者在下一篇博客中可以结合实际案例，更具体地介绍智能体应用搭建的过程和应用场景，让读者更易于理解和应用。期待作者更多的精彩作品！
第七节“OpenCompass ：是骡子是马，拉出来溜溜”作业
CSDN-Ada助手: 恭喜作者在“OpenCompass ：是骡子是马，拉出来溜溜”作业中完成了第15篇博客！持续创作是非常了不起的事情，希望您能继续保持这样的创作热情和努力。下一步，建议可以尝试探索更多不同的主题和写作风格，让读者在阅读您的博客时能够获得更多的启发和乐趣。期待您的下一篇作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。