【书生浦语大模型全链路开源体系】


详细模型介绍,请看 书生·浦语大模型全链路开源体系

一、背景

近几年来,随着人工智能行业的不断发展,大模型、大语言模型的发展火箭般的速度飞速更新迭代,从最早的GPT,到ChatGPT,再到LLaMA、GPT-4等等。
在这里插入图片描述

那么为什么大模型能在当今时代如鱼得水,以一种位面之子的形态蓬勃发展呢?

在这里插入图片描述

正是因为大模型已然 成为发展通用人工智能的重要途径!
过去,可能会使用模型只应用于一个具体的领域,如图像识别、生成等,但随着大模型的不断发展,逐步发现,只需要训练出一个强大的基础的大模型,最后只需要针对各个领域进行微调,就能取得极好的成果,相当于有了一个万能模板,这无疑为所有研究人员指明了一条道路:谁能训练出一个更强大的模板,谁就能独占鳌头!自然,大模型的发展也就以一种不可阻挡之势,持续进击!

二、书生 · 浦语大模型的发展

2.1、书生 · 浦语大模型的开源历程

在这里插入图片描述

2.2、书生 · 浦语大模型的系列

在这里插入图片描述

重点:目前轻量级和中量级模型都是开源可用的!
模型看着不错,那实际的性能是怎么样的?下面以中量级模型为例展示。

上图中的雷达图是根据OpenCompass评测

我书生 · 浦语训练只为三件事:强大、强大、还是 tmd 强大!

三、从模型到应用

在这里插入图片描述

四、书生 · 浦语全链条开源开放体系

在这里插入图片描述

4.1、数据(书生 · 万卷)

在这里插入图片描述

4.2、预训练(InternLM-Train)

在这里插入图片描述

4.3、微调(XTuner)

大语言模型的下游应用中,增量续训和有监督微调是经常会用到的两种方式:

  1. 增量续训
    • 使用场景:让基座模型学习到一些新知识,如某个垂类领域知识
    • 训练数据:文章、书籍、代码等
  2. 有监督微调
    • 使用场景:让模型学会理解和遵循各种指令,或者注入少量领域知识
    • 训练数据:高质量的对话、问答数据

在这里插入图片描述

内存不够训练不了?只需 8GB 即可畅想微调!是的,不要4090,不要A100,只需 8GB!

在这里插入图片描述

4.4、评测(OpenCompass)

国内外已经有不少评测标准,但从评测全面性来看不太能够满足现在大模型的发展

在这里插入图片描述

既然现有的标准都不太满足,那就自己造一个!

在这里插入图片描述

6大维度,80+评测集,40w+评测题目!(OpenCompass轻蔑一笑:哼,一个能打的都没有)
除此之外,你以为 OpenCompass 只是一个评测维度体系?要是真这么觉得,年轻人,还是见识少了~ 亮个相吧,小宝贝!

在这里插入图片描述

在这里插入图片描述

不止评测,还能提供工具使用,真的泰无敌辣!

在这里插入图片描述
目前支持这么多模型,但以后会越来越多的。

4.5、部署(LMDeploy)

主要包括模型轻量化、推理和服务

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.6、智能体(Lagent)

大语言模型具有一定的局限性,包括:

  • 最新信息和知识的获取

  • 回复的可靠性

  • 数学计算在这里插入图片描述

  • 工具使用和交互

不能总放着这些缺点不管,科学家有了思路,让大模型去驱动一个智能体,或者更复杂的应用来满足这些需求。通常,会搭建一个包含不同模块的智能体框架,以大语言模型作为核心来进行规划、推理、执行。

Alt

书生 · 浦语也搭建了自己的智能体——Lagent

在这里插入图片描述

不仅如此,书生 · 浦语还创建了智能体工具箱——AgentLego

在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值