书生·浦语大模型第一节：初识大模型

最新推荐文章于 2024-07-25 17:49:34 发布

wL魔法师

最新推荐文章于 2024-07-25 17:49:34 发布

阅读量449

点赞数 5

分类专栏：书生浦语言课程文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33000453/article/details/137472802

版权

书生浦语言课程专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍了书生·浦语的大模型InternLM2，包括其开源时间、不同版本的特点（如20B版本的综合性能提升和对话创作优化）、应用流程以及开放体系，涵盖了预训练、微调和评测等内容。

摘要由CSDN通过智能技术生成

视频链接：书生·浦语实战营第一节

技术报告：书生·浦语模型InternLM2技术报告

大模型与常见模型：

专用模型：针对特定任务，解决一个问题，例如YOLO、AlphaFold等

通用大模型：一种模型应对多种任务，多种模态，例如ChatGPT、InternLM等

InternLM简介：

2023年6月7日，书生·浦语大模型InternLM开源

2024年1月17日，InternLM2开源

InterLM2三种模型版本（7B：轻量级模型；20B：性能更好模型）
InternLM2-Base：基础模型
InternLM2：基于Base模型，可应对大部分实际应用（通用）
InternLM2-Chat：基于Base模型，针对对话交互进行优化（聊天）

两种版本的性能比较：

InternLM2.0特点：

1. 超长上下文：20万token
2. 综合性能提升：推理、数学、代码，20B比肩ChatGPT
3. 对话与创作：精准指令跟随，丰富的结构化创作
4. 工具调用：可支持工具多轮调用
5. 数理能力和数据分析功能：强化内生计算（不借助计算器等也具有准确的计算能力）

模型应用流程：

开放体系：

数据：http://opendatalab.org.cn/
预训练：浦语训练框架XTuner
微调：
增量续训：类似于预训练，让模型学习新知识（数据：书籍、文章、代码等）
监督微调：让模型学习理解各种指令进行对话，或者注入少量领域知识（高质量对话、问答数据）
评测：OpenCompass 2.0 司南大模型评测体系
CompassRank：中立全面的性能榜单（大语言模型、多模态模型）
CompassKit：大模型全栈工具链（评测工具，兼容100多种数据集）
CompassHub：高质量评测基准社区
部署：LMDeploy
轻量级智能体：Lagent 、AgentLego

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
书生·浦语大模型第一节：初识大模型

通用大模型：一种模型应对多种任务，多种模态，例如ChatGPT、InternLM等。InternLM2-Chat：基于Base模型，针对对话交互进行优化（聊天）监督微调：让模型学习理解各种指令进行对话，或者注入少量领域知识（高质量对话、问答数据）CompassKit：大模型全栈工具链（评测工具，兼容100多种数据集）增量续训：类似于预训练，让模型学习新知识（数据：书籍、文章、代码等）CompassRank：中立全面的性能榜单（大语言模型、多模态模型）专用模型：针对特定任务，解决一个问题，例如。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wL魔法师 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。