【书生·浦语大模型实战营第二期】学习笔记1

最新推荐文章于 2024-08-13 17:31:17 发布

墓袖远笺

最新推荐文章于 2024-08-13 17:31:17 发布

阅读量548

点赞数 20

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80703617/article/details/137172849

版权

第1节：书生·浦语大模型全链路开源开放体系

1.1书生·浦语大模型的开源历程

2023.6.7 InternLM千亿参数语言大模型发布

2023.7.6 InternLM千亿参数大模型全面升级，支持8K语境、26种语言。全面开源，免费商用：InternLM-7B模型、全链条开源工具体系

2023.8.14 书生万卷1.0多模态预训练语料库开源发布

2023.8.21 升级版对话，模型InternLM-Chat-7B v1.1发布，开源智能体框架Lagent，支持从语言模型到智能体升级转换 2023.8.28：InternLM千亿参数模型参数量升级到123B

2023.9.20 增强型InternLM-20B开源，开源工具链全线升级

2024.1.17 InternLM2开源

1.2 InternLM2的体系面对不同的使用需求，每个规格包含三个模型版本。

按规格分类

7B：为轻量级的研究和应用提供了一个轻便但性能不俗的模型

20B：模型的综合性能更为强劲，可有效支持更加复杂的使用场景

按使用需求分类

InternLM2-Base：高质量和具有很强可塑性的模型基座，是模型进行深度领域适配的高质量起点

InternLM2：在Base基础上，在多个能力方向进行了强化，在评测中成绩优异，同时保持了很好的通用语言能力，是我们推荐的在大部分应用中考虑选用的优秀基座

InternLM2-Chat：在Base基础上，经过SFT和RLHF，面向对话交互进行了优化，具有很好的指令遵循，共情聊天和调用工具等能力

1.3书生·浦语2.0 (InternLM2) 主要亮点

超长上下文：模型在20万token上下文中，几乎完美实现”大海捞针“

综合性能全面提升：推理、数学、代码提升显著InternLM2-Chat-20B在重点评测上比肩ChatGPT

优秀的对话和创作体验：精准指令跟随，丰富的结构化创作，在AlpacaEval2超越GPT3.5和Gemini Pro

工具调用能力整体升级：可靠支持工具多轮调用，复杂智能体搭建

突出的数理能力和使用的数据分析功能：强大的内生计算能力，加入代码解释后，在GSM8K和MATH达到和GPT-4相仿水平

总之，书生·浦语2.0 (InternLM2) 的性能得到了全方位的提升。

1.4书生·浦语全链条开源开放体系

数据-书生万卷：2TB数据，涵盖多种模态与任务

预训练-InternLM-Train：并行训练，极致优化，速度达到3600tokens/sec/gpu

微调-Xtuner：支持全参数微调，支持LoRA等低成本微调

部署-LMDeploy：全链路部署，性能领先，每秒生成2000+ tokens

评测-OpenCompass：全方位评测，性能可复现100套评测集，50万道题目

应用-Lagent、AgentLego：支持多种智能体，支持代码解释器等多种工具

2.0InternLM2技术报告

1.简介
2.基础设施
2.1InternEvo
2.2模型结构

3.预训练
删除重复数据；标记化
4.对齐
4.1监督微调
4.2条件奖励模型，包含不同的系统提示，针对不同类型的偏好，从而有效地模拟单一奖励模型中的各种偏好。
4.3长上下文微调
4.4工具增强LLM
5. 评价与分析
5.1对下游任务的表现
5.2对齐性能
5.3关于数据污染的探讨
6.结论

关注

20
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
【书生·浦语大模型实战营第二期】学习笔记1

2023.8.21 升级版对话，模型InternLM-Chat-7B v1.1发布，开源智能体框架Lagent，支持从语言模型到智能体升级转换 2023.8.28：InternLM千亿参数模型参数量升级到123B。InternLM2：在Base基础上，在多个能力方向进行了强化，在评测中成绩优异，同时保持了很好的通用语言能力，是我们推荐的在大部分应用中考虑选用的优秀基座。4.2条件奖励模型，包含不同的系统提示，针对不同类型的偏好，从而有效地模拟单一奖励模型中的各种偏好。
复制链接

扫一扫

墓袖远笺 CSDN认证博客专家 CSDN认证企业博客

码龄1年

13: 原创

152万+: 周排名

12万+: 总排名

5242: 访问

: 等级

236: 积分

42: 粉丝

104: 获赞

7: 评论

88: 收藏

私信

关注

热门文章

最新评论

XTuner 微调 LLM：1.8B、多模态
普通网友: 文章内容通俗易懂，适合不同层次的读者。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
OpenCompass 大模型评测实战（作业）
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Lagent & AgentLego 智能体应用搭建(笔记）
CSDN-Ada助手: 恭喜您写了第10篇博客！标题看起来很有深度，内容也充满了学术气息。希望您能继续坚持创作，分享更多有趣的内容。或许下一步可以尝试结合案例分析或者实际操作，让读者更易于理解和实践。期待您的更多精彩文章！
Lagent & AgentLego 智能体应用搭建（作业）
CSDN-Ada助手: 恭喜您第11篇博客《Lagent & AgentLego 智能体应用搭建（作业）》发表成功！您的持续创作精神令人钦佩。下一步建议可以考虑深入探讨智能体应用的实际应用场景，或者分享一些关于搭建过程中的技术难点和解决方法，让读者更深入地了解这一主题。期待您的更多精彩作品！
OpenCompass 大模型评测实战（笔记）
CSDN-Ada助手: 恭喜您发布第12篇博客《OpenCompass 大模型评测实战（笔记）》，内容精彩且实用。希望您能继续保持创作的热情和坚持，不断分享有价值的内容给读者。在下一篇博客中，或许可以尝试分享一些关于模型优化或者应用场景的实践经验，以便读者能够更深入地了解相关领域知识。期待您更多精彩的文章！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。