今天是书生·浦语大模型实战营的第一课,由上海人工智能实验室青年科学家陈恺进行讲解。下面就对第一课内容进行简要记录:
1. 大模型已成为热门关键词,在学术界和工业界都有广泛研究和应用。
2. 在arxiv上,近几年关于大模型的论文数量快速增长。
3. GPT发布后成为最热门的研究方向,OpenAI持续投入研究力量。
4. ChatGPT发布后两个月月活破亿,创纪录。
5. 大模型受到高关注的重要原因之一是发展通用人工智能(AGI)的重要途径。
大模型发展有以下趋势:
1. AI研究方向从专用模型到通用模型的转变。
2. 过去的研究主要集中在专用模型,针对特定任务解决特定问题。
3. 近年来,更倾向于使用一个模型应对多种任务和模态。
4. 通用模型的出现给予了更高阶智能的潜在途径。
1. 上海人工智能实验室投入了大量研究力量,进行大语言模型(LLM)和大模型的研究工作。
2. 实验室从今年初开始进行大语言模型的研发工作,并不断推进大模型的开源。
3. 实验室在6月7号发布了千亿参数的大语言模型,并在7月6号在世界人工智能大会上进行了全面升级。
4. 实验室推出了IntelLM-7B的全面开源免费商用单元模型,并开源了全链条的工具体系。
5. 实验室还对预训练的多模态语料库进行了多次升级,包括推出了20B的开源模型和全新升级的工具链。
1. 书生浦语已经完成了覆盖轻量级、中量级、重量级的不同大小的系列大模型。
2. 轻量级模型以7B为代表,参数量小,便于部署,适用于低成本可用的场景。
3. 中量级模型以20B为代表,参数量为200亿,能够在模型能力和推理代价之间取得平衡,并提供定制高精度模型的规模。
4. 重量级模型以123B为代表,参数量达到千亿级,具备强大的性能,包括推理能力、知识能力、理解和对话能力。
5. 目前7B和20B模型都是开源可用的商业友好协议,提供给社区开发者和企业优质的模型。
1. 20B模型在综合学科考试、知识问答、阅读理解和推理编程等领域的评测结果表现不错。
2. 在一些数据集上超过了相似量级的模型,甚至接近Llama2-70B的水平。
3. 在开源评测体系中展现了出色的性能。
1. 有了模型并不意味着能够得到基于大模型的应用,可能需要完成一些工作和借助工具或框架。
2. 大模型的应用包括智能客服、个人助手以及一些行业的应用,需要将大模型集成进来。
3. 这些模型之间存在差距,需要完成一些工作来填补这些差距。
4. 有些工具或框架可以帮助完成这些工作。举一个简单的例子,模型到最终应用之间需要完成一些工作。
1. 首先需要进行模型选型,关注模型的不同维度和能力。
2. 针对复杂业务场景,可能需要进行模型微调,但需考虑算力是否足够。
3. 如果需要与环境交互,需要构建基于大模型的智能体。
4. 模型微调通过后,可以试用于业务场景,并进行评测。
5. 模型部署需要解决资源占用和吞吐量提升的问题,可以借助专业工具和框架的辅助。
1. 数据方面,OpenMMLab开源了多模态语料库书生万卷,包括2TB的数据和多种模态和任务。
2. 预训练方面,开源了IntelLM-Train预训练框架,通过并行优化提高训练效率。
3. 微调方面,开源了XTuner框架,支持全参数微调和低成本微调。
4. 部署方面,开源了LMDeploy框架,支持全链路部署流程。
5. 评测方面,开源了OpenCompass评测工具,提供全方位评测能力,并设有公开的排行榜。
6. 应用方面,开源了Lagent和Agent lego项目,提供轻量级智能体搭建框架和丰富的工具箱。
1. 书生万卷是一个多模态的语料库,包括文本、图像和视频数据,涵盖了科技、文学、媒体、教育和法律等领域。
2. 书生万卷经过精细化处理,应用了数据预处理和数据清洗技术,并与中国的主流价值观对齐,提高了语料库的纯净度。
3. 书生万卷是开源的,除此之外,还有一个开放的数据平台提供丰富多样的开放数据供下载。
4. 这些开源数据库的构建过程注重数据内容与中国主流价值观的对齐,以提高语料库的质量和合法性。
5. 通过这些开源数据库,可以提升模型的知识逻辑和推理能力。
1. 数据平台上有超过5400个数据集,涵盖30多种模态,总共大约80TB的数据。
2. 数据集可以在Opendatalab上浏览和下载。
3. 数据平台提供了一些智能标注的工具。
1. 发布专门的全面的预训练工具,具有高可扩展性和极致的性能优化。
2. 支持从8卡到千卡的训练,加速效率达到92%,领先于其他开源框架。
3. 兼容主流生态和轻量化技术,可以与HuggingFace生态无缝接入。
4. 开箱即用,支持多种规格的语言模型,只需修改配置即可进行训练。
1. 增量续训是一种让模型学习新知识的方式,通常使用高质量的训练数据进行训练。
2. 有精度微调是让模型理解和遵循指令的过程,通常使用高质量的对话数据和问答数据进行训练。
3. 全量参数微调和部分参数微调是有监督微调中常用的方法,部分参数微调可以大大节省训练代价。
1. 开源微调框架XTuner适配多种生态和兼容不同的微调算法和策略。
2. XTuner能够直接加载Huggingface和ModelScope等开源生态的模型或数据集。
3. XTuner具备自动化优化加速功能,开发者无需关注显存优化和计算加速等细节。
4. XTuner支持多种硬件,包括NVIDIA 20系以上的显卡,最低需求为8G显存。
5. XTuner支持微调不同任务和兼容不同数据格式,同时支持主流数据集和训练引擎,并支持Llama,Qwen,ChatGLM等模型。
1. 这里介绍了国内外评测体系的整体态势,包括大模型提供评测能力的情况。
2. 一些代表性的评测工具,如HELM,FlagEval,MMLU等。
3. 这些评测工具的特点和用途:包括客观评测、主观对话和综合性评测。
4. 目前评测体系不全面,无法满足大模型发展的需求。
实验室提出的开源评测体系OpenCompass,是全球领先的评测体系,提供了六大维度和超过80个数据集,以及四十多万道评测题目。OpenCompass将大模型能力分为学科语言、知识理解、推理和安全四个维度,并在每个维度上进行细分。所有评测集都围绕这些维度进行分类和构建,以形成全面的评测体系,避免只关注某个方面或某个能力维度。
1. OpenCompass是一个提供多层次工具的评测平台。
2. 平台架构分为模型层、能力层和评测方法层。
3. 模型层支持基座模型和对话模型,并提供开源基础模型和对话模型。
4. 能力层包括通用能力评测和特色能力评测,会随着大模型领域的发展不断更新。
5. 评测方法包括自动化客观评测、模型辅助主观评测和基于人类反馈的主观评测。
1. OpenCompass是一个具有丰富模型支持和分布式评测能力的评测工具。
2. 提供了开源模型和商用API的支持,可以进行一站式模型评测。
3. 社区用户可以根据需求添加自定义数据集,并方便地进行模型评测。
4. OpenCompass具有敏捷的迭代能力,每周更新大模型的能力榜单。
5. 目前OpenCompass已经被国内外知名企业和科研机构采用,包括大模型研发机构和企业,并被Meta推荐为评测工具之一。
1. 大语言模型的主要特点包括内存开销巨大,参数量庞大,采用自回归方式生成下一个头肯,以及动态shape和token数量不确定等问题。
2. 大语言模型的模型结构相对简单,主要基于transformer结构,算子数量和种类相对较少。
3. 部署大语言模型面临技术挑战,包括设备存储、推理速度、动态shape、内存管理和利用等方面。
4. 希望提升系统整体吞吐量和降低请求平均响应时间。
5. 部署方案需要优化的技术点包括模型变形、低比特量化、attention优化、计算和访存优化,以及特有的像continuous batch这样的策略。
1. LMDeploy提供了大模型部署的全流程解决方案,包括小模型的轻量化和推理服务。
2.提供了不同的接口,如Python接口、gRPC接口和RESTful接口。
3.核心功能模块,包括模型轻量化、权重量化和推理引擎的改进。
4.提供了triton的inference server、gradio的demo和openai-server来满足不同需求。
5.提供了完备的应用工具链,能够覆盖量化推理服务的全流程,并与OpenAI接口兼容。
1. 这里展示了LMDeploy的推理性能,包括静态推理性能和动态推理性能。
2. 在静态推理性能方面,LMDeploy相比开源模型具有巨大优势。
3. 在动态推理性能方面,LMDeploy也表现出了比开源模型更好的吞吐量。
4. LMDeploy可以根据不同的数据输入输出来评测其推理性能。
5. 总体来说,LMDeploy在推理框架中具有突出的性能表现。
1. 大语言模型在获取最新信息和知识方面具备局限性。
2. 大语言模型在数学计算和外部工具使用方面可能存在问题。
3. 为了满足需求,需要将大语言模型用作智能体的驱动力。
4. 搭建智能体框架,以大元模型为核心进行规划、推理和执行。
5. 智能体可以调用不同的动作,包括网络搜索和Python代码解释器。
1. 介绍了轻量级智能体框架Lagent,可以支持不同类型的智能体能力。
2. Lagent的核心包括执行流程,根据输入选择工具,执行工具并判断技术条件。
3. 支持调用不同的大语言模型,如GPT和InternLM等,也支持Huggingface的Transformer。
4. Lagent提供简单易扩展的工具,如AI工具和能力拓展工具,还有丰富的API集合网站。
5. Lagent的目标是为用户和开发者提供简单易用的智能体解决方案。
左边的例子是通过Lagent调用Python代码解释器来求解书写题。
右边的例子是使用多模态AI工具,如视觉工具和多模态工具,完成指令。
1. AgentLego是一个针对智能体打造的工具箱。
2. AgentLego主要聚焦在为大模型提供更多可调用的工具集合。
3. AgentLego提供了包括OpenMMLab在内的多种视觉工具,并支持StableDiffusion等模型。
4. AgentLego支持多个主流智能检测系统,包括Latent和Transformer。
5. AgentLego提供了灵活的多模态工具调用接口,支持不同输入输出格式的工具函数,并支持一键式远程工具部署。
回顾本节课内容:
这节课整体介绍了书生浦语全链条的开源开放体系,包括从数据到云训练到微调、到部署、到评测、到应用的完整流程。