书生·浦语大模型训练营第一课笔记

最新推荐文章于 2024-05-29 22:15:58 发布

激谱

最新推荐文章于 2024-05-29 22:15:58 发布

阅读量679

点赞数 11

文章标签： chatgpt 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/deeepsea/article/details/135417456

版权

今天是书生·浦语大模型实战营的第一课，由上海人工智能实验室青年科学家陈恺进行讲解。下面就对第一课内容进行简要记录：

1. 大模型已成为热门关键词，在学术界和工业界都有广泛研究和应用。

2. 在arxiv上，近几年关于大模型的论文数量快速增长。

3. GPT发布后成为最热门的研究方向，OpenAI持续投入研究力量。

4. ChatGPT发布后两个月月活破亿，创纪录。

5. 大模型受到高关注的重要原因之一是发展通用人工智能（AGI）的重要途径。

大模型发展有以下趋势：

1. AI研究方向从专用模型到通用模型的转变。

2. 过去的研究主要集中在专用模型，针对特定任务解决特定问题。

3. 近年来，更倾向于使用一个模型应对多种任务和模态。

4. 通用模型的出现给予了更高阶智能的潜在途径。

1. 上海人工智能实验室投入了大量研究力量，进行大语言模型（LLM）和大模型的研究工作。

2. 实验室从今年初开始进行大语言模型的研发工作，并不断推进大模型的开源。

3. 实验室在6月7号发布了千亿参数的大语言模型，并在7月6号在世界人工智能大会上进行了全面升级。

4. 实验室推出了IntelLM-7B的全面开源免费商用单元模型，并开源了全链条的工具体系。

5. 实验室还对预训练的多模态语料库进行了多次升级，包括推出了20B的开源模型和全新升级的工具链。

1. 书生浦语已经完成了覆盖轻量级、中量级、重量级的不同大小的系列大模型。

2. 轻量级模型以7B为代表，参数量小，便于部署，适用于低成本可用的场景。

3. 中量级模型以20B为代表，参数量为200亿，能够在模型能力和推理代价之间取得平衡，并提供定制高精度模型的规模。

4. 重量级模型以123B为代表，参数量达到千亿级，具备强大的性能，包括推理能力、知识能力、理解和对话能力。

5. 目前7B和20B模型都是开源可用的商业友好协议，提供给社区开发者和企业优质的模型。

1. 20B模型在综合学科考试、知识问答、阅读理解和推理编程等领域的评测结果表现不错。

2. 在一些数据集上超过了相似量级的模型，甚至接近Llama2-70B的水平。

3. 在开源评测体系中展现了出色的性能。

1. 有了模型并不意味着能够得到基于大模型的应用，可能需要完成一些工作和借助工具或框架。

2. 大模型的应用包括智能客服、个人助手以及一些行业的应用，需要将大模型集成进来。

3. 这些模型之间存在差距，需要完成一些工作来填补这些差距。

4. 有些工具或框架可以帮助完成这些工作。举一个简单的例子，模型到最终应用之间需要完成一些工作。

1. 首先需要进行模型选型，关注模型的不同维度和能力。

2. 针对复杂业务场景，可能需要进行模型微调，但需考虑算力是否足够。

3. 如果需要与环境交互，需要构建基于大模型的智能体。

4. 模型微调通过后，可以试用于业务场景，并进行评测。

5. 模型部署需要解决资源占用和吞吐量提升的问题，可以借助专业工具和框架的辅助。

1. 数据方面，OpenMMLab开源了多模态语料库书生万卷，包括2TB的数据和多种模态和任务。

2. 预训练方面，开源了IntelLM-Train预训练框架，通过并行优化提高训练效率。

3. 微调方面，开源了XTuner框架，支持全参数微调和低成本微调。

4. 部署方面，开源了LMDeploy框架，支持全链路部署流程。

5. 评测方面，开源了OpenCompass评测工具，提供全方位评测能力，并设有公开的排行榜。

6. 应用方面，开源了Lagent和Agent lego项目，提供轻量级智能体搭建框架和丰富的工具箱。

1. 书生万卷是一个多模态的语料库，包括文本、图像和视频数据，涵盖了科技、文学、媒体、教育和法律等领域。

2. 书生万卷经过精细化处理，应用了数据预处理和数据清洗技术，并与中国的主流价值观对齐，提高了语料库的纯净度。

3. 书生万卷是开源的，除此之外，还有一个开放的数据平台提供丰富多样的开放数据供下载。

4. 这些开源数据库的构建过程注重数据内容与中国主流价值观的对齐，以提高语料库的质量和合法性。

5. 通过这些开源数据库，可以提升模型的知识逻辑和推理能力。

1. 数据平台上有超过5400个数据集，涵盖30多种模态，总共大约80TB的数据。

2. 数据集可以在Opendatalab上浏览和下载。

3. 数据平台提供了一些智能标注的工具。

1. 发布专门的全面的预训练工具，具有高可扩展性和极致的性能优化。

2. 支持从8卡到千卡的训练，加速效率达到92%，领先于其他开源框架。

3. 兼容主流生态和轻量化技术，可以与HuggingFace生态无缝接入。

4. 开箱即用，支持多种规格的语言模型，只需修改配置即可进行训练。

1. 增量续训是一种让模型学习新知识的方式，通常使用高质量的训练数据进行训练。

2. 有精度微调是让模型理解和遵循指令的过程，通常使用高质量的对话数据和问答数据进行训练。

3. 全量参数微调和部分参数微调是有监督微调中常用的方法，部分参数微调可以大大节省训练代价。

1. 开源微调框架XTuner适配多种生态和兼容不同的微调算法和策略。

2. XTuner能够直接加载Huggingface和ModelScope等开源生态的模型或数据集。

3. XTuner具备自动化优化加速功能，开发者无需关注显存优化和计算加速等细节。

4. XTuner支持多种硬件，包括NVIDIA 20系以上的显卡，最低需求为8G显存。

5. XTuner支持微调不同任务和兼容不同数据格式，同时支持主流数据集和训练引擎，并支持Llama，Qwen，ChatGLM等模型。

1. 这里介绍了国内外评测体系的整体态势，包括大模型提供评测能力的情况。

2. 一些代表性的评测工具，如HELM，FlagEval，MMLU等。

3. 这些评测工具的特点和用途：包括客观评测、主观对话和综合性评测。

4. 目前评测体系不全面，无法满足大模型发展的需求。

实验室提出的开源评测体系OpenCompass，是全球领先的评测体系，提供了六大维度和超过80个数据集，以及四十多万道评测题目。OpenCompass将大模型能力分为学科语言、知识理解、推理和安全四个维度，并在每个维度上进行细分。所有评测集都围绕这些维度进行分类和构建，以形成全面的评测体系，避免只关注某个方面或某个能力维度。

1. OpenCompass是一个提供多层次工具的评测平台。

2. 平台架构分为模型层、能力层和评测方法层。

3. 模型层支持基座模型和对话模型，并提供开源基础模型和对话模型。

4. 能力层包括通用能力评测和特色能力评测，会随着大模型领域的发展不断更新。

5. 评测方法包括自动化客观评测、模型辅助主观评测和基于人类反馈的主观评测。

1. OpenCompass是一个具有丰富模型支持和分布式评测能力的评测工具。

2. 提供了开源模型和商用API的支持，可以进行一站式模型评测。

3. 社区用户可以根据需求添加自定义数据集，并方便地进行模型评测。

4. OpenCompass具有敏捷的迭代能力，每周更新大模型的能力榜单。

5. 目前OpenCompass已经被国内外知名企业和科研机构采用，包括大模型研发机构和企业，并被Meta推荐为评测工具之一。

1. 大语言模型的主要特点包括内存开销巨大，参数量庞大，采用自回归方式生成下一个头肯，以及动态shape和token数量不确定等问题。

2. 大语言模型的模型结构相对简单，主要基于transformer结构，算子数量和种类相对较少。

3. 部署大语言模型面临技术挑战，包括设备存储、推理速度、动态shape、内存管理和利用等方面。

4. 希望提升系统整体吞吐量和降低请求平均响应时间。

5. 部署方案需要优化的技术点包括模型变形、低比特量化、attention优化、计算和访存优化，以及特有的像continuous batch这样的策略。

1. LMDeploy提供了大模型部署的全流程解决方案，包括小模型的轻量化和推理服务。

2.提供了不同的接口，如Python接口、gRPC接口和RESTful接口。

3.核心功能模块，包括模型轻量化、权重量化和推理引擎的改进。

4.提供了triton的inference server、gradio的demo和openai-server来满足不同需求。

5.提供了完备的应用工具链，能够覆盖量化推理服务的全流程，并与OpenAI接口兼容。

1. 这里展示了LMDeploy的推理性能，包括静态推理性能和动态推理性能。

2. 在静态推理性能方面，LMDeploy相比开源模型具有巨大优势。

3. 在动态推理性能方面，LMDeploy也表现出了比开源模型更好的吞吐量。

4. LMDeploy可以根据不同的数据输入输出来评测其推理性能。

5. 总体来说，LMDeploy在推理框架中具有突出的性能表现。

1. 大语言模型在获取最新信息和知识方面具备局限性。

2. 大语言模型在数学计算和外部工具使用方面可能存在问题。

3. 为了满足需求，需要将大语言模型用作智能体的驱动力。

4. 搭建智能体框架，以大元模型为核心进行规划、推理和执行。

5. 智能体可以调用不同的动作，包括网络搜索和Python代码解释器。

1. 介绍了轻量级智能体框架Lagent，可以支持不同类型的智能体能力。

2. Lagent的核心包括执行流程，根据输入选择工具，执行工具并判断技术条件。

3. 支持调用不同的大语言模型，如GPT和InternLM等，也支持Huggingface的Transformer。

4. Lagent提供简单易扩展的工具，如AI工具和能力拓展工具，还有丰富的API集合网站。

5. Lagent的目标是为用户和开发者提供简单易用的智能体解决方案。

左边的例子是通过Lagent调用Python代码解释器来求解书写题。

右边的例子是使用多模态AI工具，如视觉工具和多模态工具，完成指令。

1. AgentLego是一个针对智能体打造的工具箱。

2. AgentLego主要聚焦在为大模型提供更多可调用的工具集合。

3. AgentLego提供了包括OpenMMLab在内的多种视觉工具，并支持StableDiffusion等模型。

4. AgentLego支持多个主流智能检测系统，包括Latent和Transformer。

5. AgentLego提供了灵活的多模态工具调用接口，支持不同输入输出格式的工具函数，并支持一键式远程工具部署。

回顾本节课内容：

这节课整体介绍了书生浦语全链条的开源开放体系，包括从数据到云训练到微调、到部署、到评测、到应用的完整流程。

关注

11
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语大模型训练营第一课笔记

实验室提出的开源评测体系OpenCompass，是全球领先的评测体系，提供了六大维度和超过80个数据集，以及四十多万道评测题目。5. XTuner支持微调不同任务和兼容不同数据格式，同时支持主流数据集和训练引擎，并支持Llama，Qwen，ChatGLM等模型。3. 中量级模型以20B为代表，参数量为200亿，能够在模型能力和推理代价之间取得平衡，并提供定制高精度模型的规模。4. 重量级模型以123B为代表，参数量达到千亿级，具备强大的性能，包括推理能力、知识能力、理解和对话能力。
复制链接

扫一扫

激谱 CSDN认证博客专家 CSDN认证企业博客

码龄16年

12: 原创

69万+: 周排名

12万+: 总排名

5819: 访问

: 等级

278: 积分

84: 粉丝

116: 获赞

7: 评论

95: 收藏

私信

关注

热门文章

最新评论

书生·浦语大模型第六课笔记
CSDN-Ada助手: 恭喜您撰写了第六课的笔记，对于浦语大模型的学习进展非常了不起！继续保持这样的学习态度和创作热情是非常重要的，我期待着看到更多关于书生·浦语大模型的学习心得分享。或许在下一篇博客中，您可以分享一些实际应用案例或者自己的体会，这样可以丰富您的内容，也能够帮助更多的读者更好地理解和应用所学知识。加油！
书生·浦语大模型第六课作业
CSDN-Ada助手: 恭喜博主写下了第10篇博客！标题中提到的“浦语大模型”听起来很有趣，我很期待阅读你的文章。在这个学习的过程中，你展现了持续创作的毅力和热情，这是非常难能可贵的品质。接下来，我希望你能继续保持这样的创作动力，并在未来的文章中，可以分享一些关于该模型的实践经验和使用技巧，这将对读者来说非常有帮助。期待你的下一篇作品！
书生·浦语大模型第五课笔记
CSDN-Ada助手: 恭喜博主撰写第7篇博客！标题“书生·浦语大模型第五课笔记”让我充满期待地阅读了您的文章。您对浦语大模型的讲解非常详细，笔记内容也十分有条理，让我受益匪浅。我非常欣赏您对知识的深入研究和分享精神。在下一步的创作中，我希望您可以进一步拓展关于浦语大模型的应用场景或者深入探讨一些相关的技术细节。同时，如果您有时间的话，不妨考虑与读者进行互动，回答一些提问或者启发大家的思考。这将进一步丰富您的文章内容并增加读者的参与感。再次恭喜您的持续创作，期待您未来更多精彩的博文！谢谢您与我们分享知识！
书生·浦语大模型第五课作业
CSDN-Ada助手: 恭喜作者完成了第8篇博客！标题“书生·浦语大模型第五课作业”让我猜测这篇博客应该是关于浦语大模型的第五课作业的分享和总结。持续创作是非常了不起的事情，能够坚持写作并分享自己的见解是一个很好的习惯。在下一步的创作中，我建议您可以尝试更深入地探索浦语大模型的应用领域或是进一步分析模型的优势和不足之处。这样的创作将会更加打动读者，并为他们提供有价值的信息。感谢您的辛勤努力，期待看到更多精彩的博客！
书生·浦语大模型第四课笔记
CSDN-Ada助手: 恭喜您写了第5篇博客！标题为“书生·浦语大模型第四课笔记”。阅读您的文章，我对您坚持不懈的创作精神表示钦佩。您的笔记内容生动详实，让读者更好地理解浦语大模型。接下来，我建议您可以考虑结合实际案例或者个人经历，进一步探讨浦语大模型在实际应用中的价值和效果。期待您在下一篇博客中的精彩创作！加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。