书生·浦语大模型实战营第一节课笔记

最新推荐文章于 2024-07-20 18:05:54 发布

zpc1219

最新推荐文章于 2024-07-20 18:05:54 发布

阅读量837

点赞数 19

文章标签：笔记

本文链接：https://blog.csdn.net/zpc1219/article/details/135416066

版权

书生·浦语大模型全链路开源体系

前言

大模型成为热门关键词

不管学术界还是工业界，大模型都有着广泛的研究和应用。从下图（a）和（b）可以看到近年来Arxiv上摘要和题目包含“Language Model”或“Large Language Model”的论文数量指数级增长。自从ChatGPT发布以后，大模型迅速成为一个最热门的研究方向。自2018年以来，OpenAI一直坚持GPT的技术路线，其发布的ChatGPT2个月月活破亿！
在这里插入图片描述

大模型成为发展通用人工智能的重要途径

人工智能的研究方向从专用模型转向通用大模型。专用模型：针对特定任务，一个模型解决一个问题。通用大模型：一个模型应对多种任务、多种模态。
在这里插入图片描述

书生·浦语大模型开源历程

在大模型的浪潮下，上海人工智能实验室发布了InternLM大模型，并不断对模型和工具体系等进行升级！
在这里插入图片描述

书生·浦语大模型系列

书生·浦语大模型覆盖了轻量级、中量级和重量级这一套不同模型大小的系列。
在这里插入图片描述

从模型到应用

现在有很多开源大模型，比如书生·浦语大模型系列，但如何实现从模型到应用呢？下图展示了针对业务场景是否复杂、算力是否足够、是否需要环境交互等不同情况下从模型选型到最终的模型部署的整个链路。
在这里插入图片描述

书生·浦语全链路开源开放体系

在这里插入图片描述

数据——书生·万卷

在这里插入图片描述
海量数据可以在OpenDataLab上下载！

预训练——InternLM-Train

在这里插入图片描述

微调——Xtuner

有监督微调相比增量续训和预训练所需的数据都要少一些
在这里插入图片描述
高效微调框架XTuner

XTuner实现使用8GB消费级显卡玩转70亿参数大模型！

评测——OpenCompass

国内外评测体系的整体态势如下所示：
在这里插入图片描述
鉴于国内外评测体系存在缺陷，全球领先的更加全面的大模型开源评测体系OpenCompass被提出！

OpenCompass开源评测平台架构如下所示：

OpenCompass具有丰富模型支持、分布式高效评测、便捷的数据集接口和敏捷的的能力迭代这四个亮点。OpenCompass的用户遍及国内外知名企业和科研机构！
在这里插入图片描述