书生·浦语大模型全链路开源体系课程及 InternLM2 技术报告笔记

书生·浦语大模型全链路开源体系_哔哩哔哩_bilibili

arxiv.org/pdf/2403.17297.pdf

 

# 模型规格

7b 20b

internlm2的三个版本:internlm2质量好,internlm2-base可塑性好,internlm2-chat对话好

建模质量的提升,可以在相同数据的情况下有更好的表现。

 

# 模型亮点

1. 20w上下文,

2. 推理数学代码能力提升,

3. 结构化创作

4. 工具调用能力

5. 内生计算、代码解释

轻量级和重量级,同级无敌

 

# 应用案例

带有情感,有共情能力的对话

结构化写作,续写、创作

计算能力、1000以内计算,规划求解

可以给一份数据,让它分析

 

 

# 评测维度

经常想不到怎么总结大模型的能力,这样就挺好:

语言、知识、推理、数学、代码、智能体

 

api?怎么调用呢?后面的课程里注意一下

 作为新手,先看看摘要吧,以下是Bing翻译的结果。如果感觉不太通顺,可能是ai领域的专有名词?

 

ChatGPTGPT-4这样的大型语言模型(LLM)的发展引发了关于通用人工智能(AGI)出现的讨论。然而,在开源模型中复制这些进步一直是一项挑战。

本文介绍了InternetLM2,这是一种开源LLM,通过创新的预训练和优化技术,6个维度和30个基准的综合评估、长上下文建模和开放式主观评估方面优于其前身。

InternetLM2的预训练过程非常详细,强调了各种数据类型的准备,包括文本、代码和长上下文数据。

InternetLM2有效地捕获了长期依赖性,最初在4k个词点上进行训练,然后在预训练和微调阶段升级到32k个词点,在200k干草堆中的针测试中表现出非凡的性能。

InternLM2使用 监督微调(SFT和一种新的 基于人类反馈的条件在线强化学习(COOL-RLHF)策略 进行了进一步调整,该策略解决了人类偏好冲突和奖励黑客攻击。

通过发布不同训练阶段和模型大小的InternetLM2模型,我们为社区提供了对模型演变的见解。

 

 

作为初学者,或者门外汉。不得不把整个模型当做一个黑箱。哪怕里面的技术细节都被完整展开,着眼点还是怎么用和用来干嘛的层面。

用来干嘛:

6个维度和30个基准的综合评估、长上下文建模和开放式主观评估方面。

1 书生·浦语大模型介绍

新一代的书生大模型 InternLM2 提供三个模型版本:

  1. InternLM2-Base 基座模型,可用于新领域适配;

  2. InternLM2, 多领域中强化的版本,例如 推理、数学、代码 等。

  3. InterLM2-Chat 更符合人类指令偏好的版本,适合对话聊天,具备调用工具能力。

InternLM2 的主要亮点:

  1. 同量级、开源模型中处于领先水平;

  2. 超长上下文能力;

  3. SFT和RLHF后,更适合做知识问答、个人助手、行业应用。

2 从模型选型到应用的整个流程,以及各个环节需要做的事情

需要明确业务场景,构建智能体、评测模型、部署模型;

需要一套成熟的、高活跃度的全链路开源开放体系

  1. 书生万卷-高质量语料数据集 https://opendatalab.com/

  2. InternLM-Train https://github.com/InternLM/InternLM

  3. XTuner https://github.com/InternLM/xtuner

  4. LMDeploy https://github.com/InternLM/lmdeploy

  5. OpenCompass https://github.com/open-compass/opencompass [meta推荐]

  6. Lagent AgentLego https://github.com/InternLM/agentlego

 


上面提出了一个问题关于训练集,文中给出了答案:

 

那假如我们普通人要做一份数据集该如何组织呢?假如是纯文本的,100份公司内部公文案例,应该用txt还是doc格式?一份案例一个文件还是全部放在一个文件里?要在每个案例前标注该案例的写作目的吗?

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值