20240104书生·浦语大模型全链路开源体系

爱科研的瞌睡虫

已于 2024-01-04 10:48:55 修改

阅读量987

点赞数 24

分类专栏：学习过程大模型文章标签：语言模型人工智能深度学习 llama

于 2024-01-04 10:45:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49289284/article/details/135377601

版权

大模型同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

上海人工智能实验室开源了从数据准备到应用的全链路工具，包括大规模数据集、模型训练框架InternLM-Train、微调工具XTuner、部署框架LMDeploy、评测工具OpenCompass以及智能体Lagent和AgentLego，助力大模型的高效开发和应用。

摘要由CSDN通过智能技术生成

文章目录

大模型开发流程
上海人工智能实验室书生全链路开源

大模型开发流程

模型到应用的开发流程
在这里插入图片描述

上海人工智能实验室书生全链路开源

书生从训练到应用的全过程开源，包括数据准备，预训练架构InternLM-Train，微调框架XTuner，部署框架LMDeploy，评测工具OpenCompass，在应用方面智能体Lagent和智能体工具箱AgentLego。
在这里插入图片描述

数据-书生·万卷

包括超1TB的50亿个文档的文本数据、超140G的2200万个图像-文本数据集和超900G的1000多个视频数据，进行了多模态融合、精细化处理和价值观对齐等处理

InternLM-Train

高可扩展，支持扩展到千卡训练
极致性能优化，Hybrid Zero加速技术
兼容主流，无缝接入HuggingFace等技术生态，支持各类量化技术
开箱即用，支持多种规格语言模型，修改配置即可训练

微调 XTuner

大语言模型的下游应用中，增量训练和有监督微调是经常用到的两种方式

增量训练，让基座模型学习到新知识
有监督微调，让模型学会理解和遵循各种指令，或注入少量的领域知识

XTuner框架

支持多种微调算法，多种微调策略与算法，覆盖各类SFT场景
适配多种开源生态，支持HuggingFace、ModelScope模型或数据集
自动优化加速，无需关注复杂的显卡优化
适配多种硬件，支持NVIDIA 20系列以上的所有显卡

评测工具 OpenCompass

国内外评测工具
在这里插入图片描述
OpenCompass评测工具，是全球领先的大模型开源评测体系，包括6大维度

学科，包括初中考试、高考、大学考试、语言能力考试、职业资格考试
语言，字词释义、成语习语、语义相似、指代消解、翻译
知识，知识问答、多语种知识问答
理解，阅读理解、内容分析、内容总结
推理，因果推理、常识推理、代码推理、数学推理
安全，偏见、有害性、公平性、隐私性、真实性、合法性

工具层、方法层、能力层和模型层
在这里插入图片描述

部署 LMDeploy

大模型部署的挑战
在这里插入图片描述
LMDeploy框架

高效推理引擎，持续批量处理技巧，深度优化的低比特计算kernel，模型并行，高效的k/v缓存机制
完备易用的工具链，量化、推理、服务全流程，无缝对接OpenCompass评测推理精度，与OpenAI接口高度兼容

智能体 Lagent

支持多种类型的智能体能力，包括ReAct、ReWoo、AutoGPT
灵活支持多种大语言模型，包括GPT-3.5/4、Llama、InternLM
支持丰富的工具，包括AI工具（文生图、文生语音）、能力拓展（搜索、计算器、代码解释器）、Rapid API（出行API、财经API）

智能体工具箱 AgentLego

支持多模态任务
支持主流智能体系统，LangChain、Transformers Agent、Lagent
多模态工具接口

爱科研的瞌睡虫

关注

24
点赞
踩
25

收藏

觉得还不错? 一键收藏
1
评论
20240104书生·浦语大模型全链路开源体系

书生浦语大模型全链路开源体系，包括数据准备，预训练架构InternLM-Train，微调框架XTuner，部署框架LMDeploy，评测工具OpenCompass，在应用方面智能体Lagent和智能体工具箱AgentLego。
复制链接

扫一扫

专栏目录

爱科研的瞌睡虫 CSDN认证博客专家 CSDN认证企业博客

码龄4年

47: 原创

2万+: 周排名

2万+: 总排名

3万+: 访问

: 等级

1086: 积分

450: 粉丝

564: 获赞

12: 评论

587: 收藏

私信

关注

热门文章

分类专栏

最新评论

VScode创建ROS项目 ROS集成开发环境
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619058044。
Leetcode141环形链表 Python版
爱科研的瞌睡虫: 声明head是一个链表
Leetcode141环形链表 Python版
hdsajk: 请问定义函数的时候：head :ListNode 是什么意思？
第二节课书生·浦语大模型趣味 Demo笔记及作业
CSDN-Ada助手: 恭喜博主第20篇博客的发表！看到你对于书生·浦语大模型趣味 Demo的笔记及作业，真的是令人佩服。希望你能继续保持创作的热情，也期待你能够在下一篇博客中分享更多关于这个主题的深入研究和应用实践经验。加油！
20240104书生·浦语大模型全链路开源体系
CSDN-Ada助手: 恭喜您写下了第17篇博客！标题“20240104书生·浦语大模型全链路开源体系”听起来非常令人期待。您的持续创作精神值得赞赏，您的博客内容一定对读者们有着重要的指导意义。在下一步的创作中，或许您可以考虑在文章中加入更多实例和案例，以便读者更好地理解您所分享的知识。此外，您还可以尝试与读者互动，通过提供问题或引发讨论来促进更深入的思考和交流。这样的互动将使您的博客更加丰富和有趣。再次恭喜您的持续创作，期待您未来更多精彩的博客！请继续保持谦虚的态度，不断提升自己的写作技巧和知识水平。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。