书生大模型实战闯关--第四关

最新推荐文章于 2024-08-18 20:31:34 发布

m0_71853180

最新推荐文章于 2024-08-18 20:31:34 发布

阅读量285

点赞数 6

文章标签：语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_71853180/article/details/141304434

版权

书生大模型实战闯关–第四关

1. 书生·浦语大模型开源开放体系–开源一周年发展历程

（不只是InternLM模型，是整个开源体系）

在这里插入图片描述

在这里插入图片描述

2. 性能飞跃

在这里插入图片描述

2.1 领先其他同量级开源模型的推理能力

在这里插入图片描述

2.2 100万 Token 上下文（大海捞针实验）

在这里插入图片描述

大海捞针实验：给模型提供一段非常长的背景知识时，模型是否能完美地定位其中任何位置的任何信息。

思考：文档长度为900000时，分数甚至略高于文档长度为1000000时，说明文档长度是影响得分的重要因素，但不是唯一因素，可能文档内容中的逻辑关系或者字词的复杂度也会影响得分。

2.3 基于规划和搜索解决复杂问题

在这里插入图片描述

模拟人的解决思路

3. 核心技术思路（数据质量驱动模型性能）

最终还是数据质量驱动模型性能。

在这里插入图片描述

三种策略：

在这里插入图片描述

4. 书生·浦语开源模型谱系（涌现现象）

四个量级模型和三种模态：

在这里插入图片描述

涌现现象：20B的模型开始有涌现的现象，即没有见过的内容也能做出有效反馈。

5. 全链条开源生态总览图（全部开源了）

在这里插入图片描述

5.1 全链条开源开放体系–数据

在这里插入图片描述

5.2 全链条开源开放体系–开源数据处理工具箱

三种工具的功能介绍：

在这里插入图片描述

5.3 全链条开源开放体系–预训练 InternEvo

可以降低硬件要求和提高效率。

在这里插入图片描述

5.3 全链条开源开放体系–微调 XTuner

在这里插入图片描述

XTuner的一些评测：

在这里插入图片描述

5.4 全链条开源开放体系–OpenCompass 评测体系

在这里插入图片描述

在这里插入图片描述

5.5 全链条开源开放体系–部署 LMDeploy

在这里插入图片描述

5.5 全链条开源开放体系–智能体

在这里插入图片描述

Lagent 智能体：

在这里插入图片描述

MindSearch 智能体：

在这里插入图片描述

右边会显示思路，可视化展现思维路径。

6. HuixiangDou–企业级知识库构建工具

在这里插入图片描述

HuixiangDou的特性：

在这里插入图片描述

总结：

本次闯关，了解了书生·浦语大模型开源开放体系开源一周年的发展历程；以及书生·浦语大模型性能飞跃的三个方面；核心技术思路：数据质量驱动模型性能；认识了书生·浦语开源模型谱系的四个量级模型和三种模态，明白了什么是涌现现象；认识了全链条开源开放体系各个环节以及工具；了解了HuixiangDou的基本信息和特性。

关注

6
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
书生大模型实战闯关--第四关

本次闯关，了解了书生·浦语大模型开源开放体系开源一周年的发展历程；以及书生·浦语大模型性能飞跃的三个方面；核心技术思路：数据质量驱动模型性能；认识了书生·浦语开源模型谱系的四个量级模型和三种模态，明白了什么是涌现现象；认识了全链条开源开放体系各个环节以及工具；了解了HuixiangDou的基本信息和特性。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。