书生·浦语大模型全链路开源体系

目录

大模型成为发展通用人工智能的重要途径

书生·浦语大模型开源历程​

 书生·浦语大模型系列

书生·浦语20B开源大模型性能​

从模型到应用

模型到应用的流程框架

书生·浦语全链条开源开放体系

 数据

预训练

微调

评测

部署

应用

大模型成为发展通用人工智能的重要途径

专用模型:针对特定任务,一个模型解决一个问题
通用大模型:一个模型应对多种任务、多种模态

书生·浦语大模型开源历程

 书生·浦语大模型系列


7B 20B已经开源

书生·浦语20B开源大模型性能

从模型到应用

大模型  到智能客服、个人助手  行业应用  之间还有一段距离 需要借助一些工具或者框架去协助大模型完成到实际应用

模型到应用的流程框架



在一些简单的业务场景里面,比如一些通用的对话,可以直接使用大模型然后通过一些Prompt engineering 的方式 接入到场景。


书生·浦语全链条开源开放体系

 数据

openDatalab 数据平

预训练

微调


增量训练的数据格式一般和预训练的数据格式一样,有监督微调的形式,数据量比增量续训和预训练的数据都要小一些。

微调平台XTuner

评测


评测的全面性还不够不能满足现在大模型的一些发展的需求

评测平台 OpenCompass


比较全面的评测体系可以避免只关注大模型的某个方面或者只关注他的某一个能力维度。


openCompass  存在着一些亮点

  • 丰富的模型支持  开源模型  or api  做一站式的模型评测。
  • 分布式高效评测  主要为了评测千亿级的大模型在几十个数据集 几十万的题目上去评测。
  • 便捷的数据接口 社区用户可以根据自身的需求快速添加一些自定义的数据集(比如关注模型的某一方面的能力或者针对评测有一些新的研究 可以基于open compass 把自己构建的数据集接入进来 批量的进行模型评测 )
  • 敏捷的能力迭代 (每周更新大模型的能力的榜单)

部署


 
 部署平台LMDeploy

应用

 模型如何去驱动一个更复杂的应用?
 搭建一个包括不同的模块的智能体框架

智能体 是以LLM为核心进行一些规划、推理、执行的框架
可能会去调用不同的工具,执行不同的动作(网络搜索 python代码解释器)利用LLM强大的推理能力去做一些规划或者调用链的设计 

Lagent 是搭建智能体的整个框架
AgentLego   是给大模型提供更多的工具集合,使得LLM有可调用的工具

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值