书生·浦语大模型全链路开源体系

星云雨沫

于 2024-01-04 13:31:40 发布

阅读量344

点赞数 9

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48478550/article/details/135383607

版权

目录

大模型成为发展通用人工智能的重要途径

书生·浦语大模型开源历程

书生·浦语大模型系列

书生·浦语20B开源大模型性能

从模型到应用

模型到应用的流程框架

书生·浦语全链条开源开放体系

大模型成为发展通用人工智能的重要途径

专用模型:针对特定任务，一个模型解决一个问题
通用大模型：一个模型应对多种任务、多种模态

书生·浦语大模型开源历程

书生·浦语大模型系列

7B 20B已经开源

书生·浦语20B开源大模型性能

从模型到应用

大模型到智能客服、个人助手行业应用之间还有一段距离需要借助一些工具或者框架去协助大模型完成到实际应用

模型到应用的流程框架

在一些简单的业务场景里面，比如一些通用的对话，可以直接使用大模型然后通过一些Prompt engineering 的方式接入到场景。

书生·浦语全链条开源开放体系

数据

openDatalab 数据平台

预训练

微调

增量训练的数据格式一般和预训练的数据格式一样，有监督微调的形式，数据量比增量续训和预训练的数据都要小一些。

微调平台XTuner

评测

评测的全面性还不够不能满足现在大模型的一些发展的需求

评测平台 OpenCompass

比较全面的评测体系可以避免只关注大模型的某个方面或者只关注他的某一个能力维度。

openCompass 存在着一些亮点

丰富的模型支持开源模型 or api 做一站式的模型评测。
分布式高效评测主要为了评测千亿级的大模型在几十个数据集几十万的题目上去评测。
便捷的数据接口社区用户可以根据自身的需求快速添加一些自定义的数据集（比如关注模型的某一方面的能力或者针对评测有一些新的研究可以基于open compass 把自己构建的数据集接入进来批量的进行模型评测）
敏捷的能力迭代（每周更新大模型的能力的榜单）

部署

部署平台LMDeploy

应用

模型如何去驱动一个更复杂的应用？
搭建一个包括不同的模块的智能体框架

智能体是以LLM为核心进行一些规划、推理、执行的框架
可能会去调用不同的工具，执行不同的动作（网络搜索 python代码解释器）利用LLM强大的推理能力去做一些规划或者调用链的设计

Lagent 是搭建智能体的整个框架
AgentLego 是给大模型提供更多的工具集合，使得LLM有可调用的工具

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语大模型全链路开源体系

书生·浦语大模型全链路开源体系介绍
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。