书生·浦语大模型训练营 第一课 笔记

今天是书生·浦语大模型实战营的第一课,由上海人工智能实验室青年科学家陈恺进行讲解。下面就对第一课内容进行简要记录:

1. 大模型已成为热门关键词,在学术界和工业界都有广泛研究和应用。

2. 在arxiv上,近几年关于大模型的论文数量快速增长。

3. GPT发布后成为最热门的研究方向,OpenAI持续投入研究力量。

4. ChatGPT发布后两个月月活破亿,创纪录。

5. 大模型受到高关注的重要原因之一是发展通用人工智能(AGI)的重要途径。

大模型发展有以下趋势:

1. AI研究方向从专用模型到通用模型的转变。

2. 过去的研究主要集中在专用模型,针对特定任务解决特定问题。

3. 近年来,更倾向于使用一个模型应对多种任务和模态。

4. 通用模型的出现给予了更高阶智能的潜在途径。

1. 上海人工智能实验室投入了大量研究力量,进行大语言模型(LLM)和大模型的研究工作。

2. 实验室从今年初开始进行大语言模型的研发工作,并不断推进大模型的开源。

3. 实验室在6月7号发布了千亿参数的大语言模型,并在7月6号在世界人工智能大会上进行了全面升级。

4. 实验室推出了IntelLM-7B的全面开源免费商用单元模型,并开源了全链条的工具体系。

5. 实验室还对预训练的多模态语料库进行了多次升级,包括推出了20B的开源模型和全新升级的工具链。

1. 书生浦语已经完成了覆盖轻量级、中量级、重量级的不同大小的系列大模型。

2. 轻量级模型以7B为代表,参数量小,便于部署,适用于低成本可用的场景。

3. 中量级模型以20B为代表,参数量为200亿,能够在模型能力和推理代价之间取得平衡,并提供定制高精度模型的规模。

4. 重量级模型以123B为代表,参数量达到千亿级,具备强大的性能,包括推理能力、知识能力、理解和对话能力。

5. 目前7B和20B模型都是开源可用的商业友好协议,提供给社区开发者和企业优质的模型。

1. 20B模型在综合学科考试、知识问答、阅读理解和推理编程等领域的评测结果表现不错。

2. 在一些数据集上超过了相似量级的模型,甚至接近Llama2-70B的水平。

3. 在开源评测体系中展现了出色的性能。

1. 有了模型并不意味着能够得到基于大模型的应用,可能需要完成一些工作和借助工具或框架。

2. 大模型的应用包括智能客服、个人助手以及一些行业的应用,需要将大模型集成进来。

3. 这些模型之间存在差距,需要完成一些工作来填补这些差距。

4. 有些工具或框架可以帮助完成这些工作。举一个简单的例子,模型到最终应用之间需要完成一些工作。

1. 首先需要进行模型选型,关注模型的不同维度和能力。

2. 针对复杂业务场景,可能需要进行模型微调,但需考虑算力是否足够。

3. 如果需要与环境交互,需要构建基于大模型的智能体。

4. 模型微调通过后,可以试用于业务场景,并进行评测。

5. 模型部署需要解决资源占用和吞吐量提升的问题,可以借助专业工具和框架的辅助。

1. 数据方面,OpenMMLab开源了多模态语料库书生万卷,包括2TB的数据和多种模态和任务。

2. 预训练方面,开源了IntelLM-Train预训练框架,通过并行优化提高训练效率。

3. 微调方面,开源了XTuner框架,支持全参数微调和低成本微调。

4. 部署方面,开源了LMDeploy框架,支持全链路部署流程。

5. 评测方面,开源了OpenCompass评测工具,提供全方位评测能力,并设有公开的排行榜。

6. 应用方面,开源了Lagent和Agent lego项目,提供轻量级智能体搭建框架和丰富的工具箱。

1. 书生万卷是一个多模态的语料库,包括文本、图像和视频数据,涵盖了科技、文学、媒体、教育和法律等领域。

2. 书生万卷经过精细化处理,应用了数据预处理和数据清洗技术,并与中国的主流价值观对齐,提高了语料库的纯净度。

3. 书生万卷是开源的,除此之外,还有一个开放的数据平台提供丰富多样的开放数据供下载。

4. 这些开源数据库的构建过程注重数据内容与中国主流价值观的对齐,以提高语料库的质量和合法性。

5. 通过这些开源数据库,可以提升模型的知识逻辑和推理能力。

1. 数据平台上有超过5400个数据集,涵盖30多种模态,总共大约80TB的数据。

2. 数据集可以在Opendatalab上浏览和下载。

3. 数据平台提供了一些智能标注的工具。

1. 发布专门的全面的预训练工具,具有高可扩展性和极致的性能优化。

2. 支持从8卡到千卡的训练,加速效率达到92%,领先于其他开源框架。

3. 兼容主流生态和轻量化技术,可以与HuggingFace生态无缝接入。

4. 开箱即用,支持多种规格的语言模型,只需修改配置即可进行训练。

1. 增量续训是一种让模型学习新知识的方式,通常使用高质量的训练数据进行训练。

2. 有精度微调是让模型理解和遵循指令的过程,通常使用高质量的对话数据和问答数据进行训练。

3. 全量参数微调和部分参数微调是有监督微调中常用的方法,部分参数微调可以大大节省训练代价。

1. 开源微调框架XTuner适配多种生态和兼容不同的微调算法和策略。

2. XTuner能够直接加载Huggingface和ModelScope等开源生态的模型或数据集。

3. XTuner具备自动化优化加速功能,开发者无需关注显存优化和计算加速等细节。

4. XTuner支持多种硬件,包括NVIDIA 20系以上的显卡,最低需求为8G显存。

5. XTuner支持微调不同任务和兼容不同数据格式,同时支持主流数据集和训练引擎,并支持Llama,Qwen,ChatGLM等模型。

1. 这里介绍了国内外评测体系的整体态势,包括大模型提供评测能力的情况。

2. 一些代表性的评测工具,如HELM,FlagEval,MMLU等。

3. 这些评测工具的特点和用途:包括客观评测、主观对话和综合性评测。

4. 目前评测体系不全面,无法满足大模型发展的需求。

实验室提出的开源评测体系OpenCompass,是全球领先的评测体系,提供了六大维度和超过80个数据集,以及四十多万道评测题目。OpenCompass将大模型能力分为学科语言、知识理解、推理和安全四个维度,并在每个维度上进行细分。所有评测集都围绕这些维度进行分类和构建,以形成全面的评测体系,避免只关注某个方面或某个能力维度。

1. OpenCompass是一个提供多层次工具的评测平台。

2. 平台架构分为模型层、能力层和评测方法层。

3. 模型层支持基座模型和对话模型,并提供开源基础模型和对话模型。

4. 能力层包括通用能力评测和特色能力评测,会随着大模型领域的发展不断更新。

5. 评测方法包括自动化客观评测、模型辅助主观评测和基于人类反馈的主观评测。

1. OpenCompass是一个具有丰富模型支持和分布式评测能力的评测工具。

2. 提供了开源模型和商用API的支持,可以进行一站式模型评测。

3. 社区用户可以根据需求添加自定义数据集,并方便地进行模型评测。

4. OpenCompass具有敏捷的迭代能力,每周更新大模型的能力榜单。

5. 目前OpenCompass已经被国内外知名企业和科研机构采用,包括大模型研发机构和企业,并被Meta推荐为评测工具之一。

1. 大语言模型的主要特点包括内存开销巨大,参数量庞大,采用自回归方式生成下一个头肯,以及动态shape和token数量不确定等问题。

2. 大语言模型的模型结构相对简单,主要基于transformer结构,算子数量和种类相对较少。

3. 部署大语言模型面临技术挑战,包括设备存储、推理速度、动态shape、内存管理和利用等方面。

4. 希望提升系统整体吞吐量和降低请求平均响应时间。

5. 部署方案需要优化的技术点包括模型变形、低比特量化、attention优化、计算和访存优化,以及特有的像continuous batch这样的策略。

1. LMDeploy提供了大模型部署的全流程解决方案,包括小模型的轻量化和推理服务。

2.提供了不同的接口,如Python接口、gRPC接口和RESTful接口。

3.核心功能模块,包括模型轻量化、权重量化和推理引擎的改进。

4.提供了triton的inference server、gradio的demo和openai-server来满足不同需求。

5.提供了完备的应用工具链,能够覆盖量化推理服务的全流程,并与OpenAI接口兼容。

1. 这里展示了LMDeploy的推理性能,包括静态推理性能和动态推理性能。

2. 在静态推理性能方面,LMDeploy相比开源模型具有巨大优势。

3. 在动态推理性能方面,LMDeploy也表现出了比开源模型更好的吞吐量。

4. LMDeploy可以根据不同的数据输入输出来评测其推理性能。

5. 总体来说,LMDeploy在推理框架中具有突出的性能表现。

1. 大语言模型在获取最新信息和知识方面具备局限性。

2. 大语言模型在数学计算和外部工具使用方面可能存在问题。

3. 为了满足需求,需要将大语言模型用作智能体的驱动力。

4. 搭建智能体框架,以大元模型为核心进行规划、推理和执行。

5. 智能体可以调用不同的动作,包括网络搜索和Python代码解释器。

1. 介绍了轻量级智能体框架Lagent,可以支持不同类型的智能体能力。

2. Lagent的核心包括执行流程,根据输入选择工具,执行工具并判断技术条件。

3. 支持调用不同的大语言模型,如GPT和InternLM等,也支持Huggingface的Transformer。

4. Lagent提供简单易扩展的工具,如AI工具和能力拓展工具,还有丰富的API集合网站。

5. Lagent的目标是为用户和开发者提供简单易用的智能体解决方案。

左边的例子是通过Lagent调用Python代码解释器来求解书写题。

右边的例子是使用多模态AI工具,如视觉工具和多模态工具,完成指令。

1. AgentLego是一个针对智能体打造的工具箱。

2. AgentLego主要聚焦在为大模型提供更多可调用的工具集合。

3. AgentLego提供了包括OpenMMLab在内的多种视觉工具,并支持StableDiffusion等模型。

4. AgentLego支持多个主流智能检测系统,包括Latent和Transformer。

5. AgentLego提供了灵活的多模态工具调用接口,支持不同输入输出格式的工具函数,并支持一键式远程工具部署。

回顾本节课内容:

这节课整体介绍了书生浦语全链条的开源开放体系,包括从数据到云训练到微调、到部署、到评测、到应用的完整流程。

  • 11
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值