书生浦语大模型全链路开源体系-课程笔记

最新推荐文章于 2024-07-08 17:01:05 发布

_Y_M_Y_

最新推荐文章于 2024-07-08 17:01:05 发布

阅读量1.6k

点赞数 35

文章标签：笔记语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44555688/article/details/137204494

版权

书生浦语大模型全链路开源体系

以高质量开源赋能创新

大模型成为发展通用人工智能的重要途径。

2021年之前是针对特定任务，一个模型解决一个问题（ImageNet竞赛2012、人脸识别2014、围棋比赛2016、AlphaFold2021）
最近两年在向通用大模型发展，一个模型应对多种任务、多种模态。

InternLM2 概述

书生浦语的开源历程

2023年6月7日InternLM开源
2024年1月17日InternLM2开源

书生浦语2.0（InternLM2）的体系

尺寸	模型基座（可塑性强）	多能力强化（推荐用于微调）	对话交互优化
7B 轻量化	InternLM2-Base	InternLM2	InternLM2-Chat
20B 综合能力强	InternLM2-Base	InternLM2	InternLM2-Chat

InternLM2：回归语言建模的本质

新一点数据清洗过滤技术

多维度数据价值评估
高质量预料驱动的数据富集
有针对性的数据补齐

InternLM2的主要亮点

超强的上下文
综合性能全面提升。代码、数学、推理、知识、语言、考试，20B的模型比肩GPT3.5。
优秀的对话和创作体验。想象力ok。
工具调用能力整体升级。日程安排。
突出的数理能力和实用的数据分析功能。高准确率，复杂运算和求解，加入代码解释器后，在GSM8K和MATH上超过GPT4。上传表格，分析表格文件，概述，绘制趋势图（调用maiplot），要求模型使用机器学习算法做预测（sklearn）。

从模型到应用

应用：智能客服、个人助手、行业应用
从模型到应用是有GAP的，需要一个复杂的流程

书生浦语全链条开源开放体系

开发了全链条的工具

数据

OpenDataLab：书生万卷1.0（2TB），书生万卷CC（400GB）

预训练

微调

XTuner开源框架
- 增量续训：新知识、垂直领域知识
- 有监督微调：可以降低微调成本

评测

2024年1月30日，OpenCompass2.0 司南大模型评测体系
- CompassRank：中立全面的性能榜单
- CompassKit：大模型评测全站工具链。
  - 数据污染检查
  - 更丰富的模型推理接入
  - 长文本能力评测
  - 中英文双语主观评测
- CompassHub：高质量评测基准社区
  - 希望构建大模型评测基准社区
OpenCompass助力大模型产业发展和学术研究，广泛应用于头部大模型企业和科研机构，获得Meta官方推荐
根据评测结果洞见未来，形成年度榜单综合性客观评价，语言、知识、推理、数学、代码、智能体。国内部分大模型已经接近GPT4水平，国内模型在中文场景有优势，开源社区未来可期。
- 整体能力仍有较大提升空间
- 复杂推理仍是短板
- “理科”能力和模型尺寸关联性高
- 模型主客观性能需综合参考

部署

LMDeploy
部署通常是模型上线环节的最后一个环节
LMDeploy在A100上的部署效率高于vLLM

智能体

轻量级智能体框架Lagent
有很多内置工具，可以直接使用，比如代码解数学题、零样本泛化

多模态智能体工具箱AgentLego，是一个工具集合。可以将语言模型拓展为多模态智能体。
封装了OpenMMLab，SD，SAM等等模型。

关注

35
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
书生浦语大模型全链路开源体系-课程笔记

书生浦语大模型实战训练营第二期第一课，课程笔记。课程讲座视频链接https://www.bilibili.com/video/BV1Vx421X72D/?spm_id_from=333.999.0.0
复制链接

扫一扫

_Y_M_Y_ CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

153万+: 周排名

11万+: 总排名

6050: 访问

: 等级

230: 积分

80: 粉丝

88: 获赞

8: 评论

76: 收藏

私信

关注

热门文章

最新评论

第四课课程笔记 XTuner 微调 LLM：1.8B、多模态、Agent
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
第四课课程笔记 XTuner 微调 LLM：1.8B、多模态、Agent
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
第七课课程笔记 OpenCompass大模型评测
CSDN-Ada助手: 恭喜用户撰写第12篇博客！标题“第七课课程笔记 OpenCompass大模型评测”听起来很有深度和挑战性。希望您能继续保持创作的热情和努力，为读者带来更多有价值的内容。或许在下一篇博客中，可以分享一些自己的实践经验或者对于大模型评测的一些新见解，让读者有更多启发和思考。期待您的下一篇作品！祝您创作顺利！
第七课作业 OpenCompass实操
CSDN-Ada助手: 恭喜您在第七课作业中成功实操OpenCompass！持续创作是非常重要的，您的努力让您不断进步。在下一篇博客中，也许可以分享一些关于OpenCompass的实操经验和技巧，让更多读者受益。祝您创作顺利，期待您更多精彩的作品！
第四课课程笔记 XTuner 微调 LLM：1.8B、多模态、Agent
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中提到的XTuner 微调 LLM：1.8B、多模态、Agent听起来非常有趣。希望您能继续坚持创作，分享更多有价值的内容。下一步可以考虑探讨一些实际案例或者应用场景，以便读者更好地理解和应用您所分享的知识。期待您的下一篇作品！祝您创作顺利！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。