书生大模型实战营 L1-1 书生大模型全链路开源体系

Laccoliths

于 2024-08-18 19:38:31 发布

阅读量91

点赞数 2

文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/csdn8668/article/details/141304227

版权

1 读书笔记

大模型已经成为发展AGI的重要途径，传统的专用模型是针对特定任务，一个模型解决一个问题，比如ImageNet竞赛中涌现的分类模型，AlphaFold等等。
而通用模型旨在利用一个模型完成All任务，对应多种模态。比如GPT4通过Prompt实现。
书生浦语大模型开源历程：从2023年6月7日的InternLM，到2024年1月17日的InternLM2开源，实际上2024 年7月3日，已经发布了InternLM2.5，有3大亮点：

推理能力大幅提升，领先于国内外同量级开源模型，在部分维度上甚至超越十倍量级的 Llama3-70B；
支持 1M tokens 上下文，能够处理百万字长文；
具有强大的自主规划和工具调用能力，比如可以针对复杂问题，搜索上百个网页并进行整合分析。
InternLM2的体系：面向不同的使用需求，采用不同的规格，每个规格包括了3个模型版本。

从7B-20B，包括了Base、LM2和Chat版本。Base属于高质量、可塑性强的基准模型，适合在深度领域适配；LM2在多个能力方向强化，保持了很好的通用语言能力，更加推荐使用；Chat经过SFT、RLHF，面相对话交互进行了优化，具有很强的指令遵循、共情聊天和调用工具的能力。

回归语言建模的本质：采用新一代数据清洗过滤技术，包括多维度数据价值评估、高质量语料驱动的数据集和有针对的数据补齐。

主要亮点：

20W Token超长上下文
推理、数学和代码能力比肩GPT
精准指令遵循
可靠支持工具、复杂智能体搭建
强大的内生计算能力，加入了代码解释

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
书生大模型实战营 L1-1 书生大模型全链路开源体系

从7B-20B，包括了Base、LM2和Chat版本。LM2在多个能力方向强化，保持了很好的通用语言能力，更加推荐使用；Chat经过SFT、RLHF，面相对话交互进行了优化，具有很强的指令遵循、共情聊天和调用工具的能力。大模型已经成为发展AGI的重要途径，传统的专用模型是针对特定任务，一个模型解决一个问题，比如ImageNet竞赛中涌现的分类模型，AlphaFold等等。回归语言建模的本质：采用新一代数据清洗过滤技术，包括多维度数据价值评估、高质量语料驱动的数据集和有针对的数据补齐。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Laccoliths 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。