书生·浦语大模型全链路开源体系

最新推荐文章于 2024-07-18 12:25:14 发布

纯野生钢铁侠

最新推荐文章于 2024-07-18 12:25:14 发布

阅读量468

点赞数 7

分类专栏：书生大模型实战文章标签： python 人工智能语言模型 llama chatgpt 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53408051/article/details/135462628

版权

书生大模型实战专栏收录该内容

1 篇文章 0 订阅

订阅专栏

#本博客是参加上海人工智能实验室OPENMMLAB大模型实战营活动而作

一、背景

当下大模型已经成为发展通用人工智能的重要途径。

以往的人工智能发展大多为专用性人工智能，自2006年深度学习理论完成突破后，无论是2012年的ImageNet，抑或是14年LFW人脸识别上99%超越人类的识别准确率，抑或是2016年的AlphaGo 4:1李世石的围棋比赛，都是优秀的专用型人工智能的代表。然而随着实际问题需求的改变与增长，人们迫切的需要一个任务应对多种模态，通用大模型应运而生。

上海人工智能实验室也是投入了非常大的力量在大语言模型上：（图源侵删）

二、书生·浦语大模型的介绍

到现在为止，书生浦语大模型可分为三个系列：

轻量级，InternLM-7B，70亿参数，小巧轻便便于部署
中量级，InternLM-20B，200亿参数，在模型与推理之间取得平衡
重量级, InternLM-123B，1230亿参数，性能强大

InternLM-20B在多维度上都有着比较优异的表现（见上图）

任何一个模型从研发出来到实际部署应用，都需要经过比较多的迭代步骤与环节，为此书生·浦语开放了全链条开放体系。

除了上述开源链条外，还开放了OpenDataLab 数据平台，其中提供了丰富种类的数据：

接下来介绍一下InternLM-train工具的特点：

三、大语言模型的微调：（见后续博客）

大语言模型的下游应用中，增量续训和有监督微调是经常用到的两种方式。

增量续训

使用场景：让基座模型学到一些新知识，比如某个垂类领域知识

训练数据：文章、书籍、代码等

有监督微调

使用场景：让模型学会理解和遵循各种指令，或者注入少量领域知识

训练数据：高质量对话、问答数据

可以分为以下两种：

全量参数微调：基于预训练模型（已经学到了大量的通用特征和语义信息，因此在目标任务上可能能够更快地收敛和取得更好的性能）来对模型整体进行调整，（不仅是输出层）全量参数微调也可能需要更大的计算资源和训练时间，因为需要调整的参数更多。

部分参数微调：微调过程中，只调整预训练模型的部分参数而不是整个模型的参数。通常，这涉及冻结预训练模型的一部分层（通常是底层或中间层），使其在微调期间保持不变，而只调整模型的一小部分参数，通常是输出层或顶层。

关于微调，开源了高效的微调框架Xtuner，适配多种生态：

可以在8GB的显存上实现7B模型的微调（还是很强的）

四、大语言模型的评测：OpenCompass

当前国内外有很多种评价体系与评测方式：（如下）

OpenCampass从六个维度来进行评价模型的能力：

架构主要分为四层：

模型层：支持了基座模型和对话模型（已开源）

能力层：通用能力和特色能力两部分评价

评测方法：自动化客观、基于模型辅助的主观、基于人类反馈的主观

工具层：分布式、提示词工程、评测数据库上报、评测榜单发布、评测报告生成

五、大语言模型的部署 LMDeploy

大语言模型本身的特点，给部署上带来了一系列的技术挑战

纯野生钢铁侠

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
书生·浦语大模型全链路开源体系

本博客是参加上海人工智能实验室OPENMMLAB大模型实战营活动而作,简要介绍了书生·浦语开源框架体系
复制链接

扫一扫

专栏目录

纯野生钢铁侠 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

132万+: 周排名

12万+: 总排名

1万+: 访问

: 等级

195: 积分

87: 粉丝

118: 获赞

8: 评论

187: 收藏

私信

关注

热门文章

分类专栏

书生大模型实战 1篇

最新评论

卡尔曼滤波器 Kalman Filter(Part 1)
CSDN-Ada助手: 恭喜您撰写了这么有深度的博客！Kalman Filter是一个非常复杂且重要的主题，您能够将其分成多个部分进行讲解，让读者更容易理解，实属不易。接下来，我建议您在接下来的部分中可以通过实例或者案例来解释Kalman Filter的应用，这样会更具体、更生动，也更容易让读者理解。期待您的下一篇博客！
基于InternLM和LangChain 搭建自己的知识库
CSDN-Ada助手: 恭喜作者在博客领域持续创作，这篇“基于InternLM和LangChain 搭建自己的知识库”非常有深度和实用性。希望作者继续保持创作的热情，同时建议可以考虑分享一些实际应用案例或者对于知识库搭建过程中遇到的挑战和解决方案的思考，这样可以让读者更加深入地了解这一主题。期待作者的下一篇作品！
轻松玩转书生·浦语大模型趣味Demo
CSDN-Ada助手: 恭喜您撰写第9篇博客！看了《轻松玩转书生·浦语大模型趣味Demo》，感觉您对书生的理解和运用非常深入，展示的Demo也十分有趣味性。希望您能继续保持创作的热情和耐心，为读者带来更多精彩的内容。或许在下一篇博客中，可以探讨一下书生模型的应用场景或者与其他技术的结合，让读者更加深入地了解这一领域。期待您更多的精彩作品！
书生·浦语大模型全链路开源体系
纯野生钢铁侠: 想看的老铁们点点赞，我继续更新
NVIDIA Jetson 全家桶刷机教程以及将系统迁移到SSD、SD卡上（胎儿级教程）
纯野生钢铁侠: 感谢肯定！！！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。