【InternLM 实战营第二期】第五节笔记

最新推荐文章于 2024-10-18 15:24:28 发布

2301_77831574

最新推荐文章于 2024-10-18 15:24:28 发布

阅读量485

点赞数 10

文章标签：笔记

本文链接：https://blog.csdn.net/2301_77831574/article/details/138096977

版权

【InternLM 实战营第二期】第五节笔记

第五节 LMDeploy 量化部署 LLM-VLM 实践

参考：

视频教学：https://www.bilibili.com/video/BV1tr421x75B/
文档链接：https://github.com/InternLM/Tutorial/blob/camp2/

一、大模型部署背景

在这里插入图片描述
大模型部署面临的挑战：

计算量巨大
内存开销巨大
访存瓶颈
动态请求
请求量不确定；请求时间不确定；Token逐个生成，生成数量不确定。

二、大模型部署方法

模型剪枝
知识蒸馏
知识蒸馏是一种经典的模型压缩方法，核心思想是通过引导轻量化的学生模型“模仿”性性能更好、结构更复杂的教师模型，在不改变学生模型结构的情况下提高其性能。
量化

三、LMDeploy简介

LMDeploy核心功能

模型高效推理
参考命令：lmdeploychat-h
模型量化压缩
参考命令：lmdeploylite-h
服务化部署
参考命令：lmdeployserve-h

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

2301_77831574

关注关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【书生·浦语大模型实战营】学习笔记（一）：全链路开源体系介绍

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

03-31

1757

本文为实战营第一次课程笔记，主要分为两个部分，第一部分从书生·浦语大模型发展、分类、组成进行详细介绍，方便大家理解。第二部分为对 InternLM2技术报告解读，后续系列会继续更新，欢迎大家交流！

【InternLM 实战营第二期】第四节笔记

2301_77831574的博客

04-19

595

两种Finetune范式LLM 的下游应用中，增量预训练和指令跟随是经常会用到两种的微调模式增量预训练微调使用场景:让基座模型学习到一些新知识，如某个垂类领域的常识训练数据:文章、书籍、代码等指令跟随微调使用场景:让模型学会对话模板，根据人类指令进行对话训练数据:高质量的对话、问答数例子一条数据的一生对话模板：对话模板是为了能够让LLM区分出，SystemUser和Assistant，不同的模型会有不同的模板。

1 条评论您还未登录，请先登录后发表或查看评论

InternLM实战营第二期---第一节课笔记

l18817813618的博客

04-01

563

例如深度置信网络，ImageNet 图像分类，AlphaGO AlphaFold 大规模语音识别人脸识别德州扑克书生.浦语大模型2023年6月7日千亿大模型发布，7月6号开源免费商用，8月多模态语料发布月底开源智能体架构Lagent 框架，8月底升级123B千亿参数模型，9月底InternLM 开源.书生.浦语2.0体系。

InternLM实战营第二期第3节课笔记-XTuner微调多模态Agent

maizijieguida的博客

06-06

1499

激活环境。

【InternLM 实战营第二期作业】第二节

2301_77831574的博客

04-02

338

【InternLM 实战营第二期笔记】

【InternLM 实战营第二期】第五节作业

2301_77831574的博客

04-23

303

参考：视频教学：https://www.bilibili.com/video/BV1tr421x75B/文档链接：https://github.com/InternLM/Tutorial/blob/camp2/笔记：https://blog.csdn.net/2301_77831574/article/details/138096977?

【InternLM 实战营第二期-笔记5】LMDeploy 量化部署 LLM&VLM实战

Oven_maizi的博客

04-12

1147

书生·浦语是上海人工智能实验室和商汤科技联合研发的一款大模型,很高兴能参与本次第二期训练营，我也将会通过笔记博客的方式记录学习的过程与遇到的问题，并为代码添加注释，希望可以帮助到你们。

【InternLM 实战营第二期笔记07】OpenCompass 大模型评测实战

qq_74261455的博客

04-22

1291

OpenCompass是上海人工智能实验室开源的大模型评测平台，该平台具有一系列显著的特点和功能。首先，它提供了开源可复现的评测方案，保证了评测的公平、公开和可复现性。这为研究者提供了一个稳定可靠的基准，使得不同模型之间的比较更加准确和有意义。其次，OpenCompass在评测维度上非常全面，涵盖了学科、语言、知识、理解、推理等五大维度。

【InternLM 实战营第二期笔记5】LMDeploy 量化部署 LLM-VLM 实践

qq_45776432的博客

04-16

1120

本笔记主要是关于大模型部署的一些介绍以及LMDeploy的一些相关实践。

【InternLM 实战营第二期笔记】InternLM1.8B浦语大模型趣味 Demo

JeffDing

04-01

1166

自由指令输入的图文写作能力：浦语·灵笔2 可以理解自由形式的图文指令输入，包括大纲、文章细节要求、参考图片等，为用户打造图文并貌的专属文章。生成的文章文采斐然，图文相得益彰，提供沉浸式的阅读体验。准确的图文问题解答能力：浦语·灵笔2 具有海量图文知识，可以准确的回复各种图文问答难题，在识别、感知、细节描述、视觉推理等能力上表现惊人。

【书生·浦语大模型实战营】学习笔记（二）：轻松玩转书生·浦语大模型趣味Demo

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

04-05

1230

本文为实战营第二次课程笔记，主要分为两个部分，第一部分部署 InternLM2-Chat-1.8B 模型进行智能对话。第二部分为完成 Lagent 工具调用数据分析 Demo 部署，后续系列会继续更新，欢迎大家交流！

【第7节】OpenCompass 大模型评测实战

熊猫小妖的AI世界

04-24

919

上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0)，用于为大语言模型、多模态模型等提供一站式评测服务。开源可复现：提供公平、公开、可复现的大模型评测方案全面的能力维度：五大维度设计，提供 70+ 个数据集约 40 万题的的模型评测方案，全面评估模型能力丰富的模型支持：已支持 20+ HuggingFace 及 API 模型分布式高效评测：一行命令实现任务分割和分布式评测，数小时即可完成千亿模型全量评测。

NL2SQL进阶系列(5)：论文解读业界前沿方案（DIN-SQL、C3-SQL、DAIL-SQL、SQL-PaLM）、新一代数据集BIRD-SQL解读

丨汀、的博客

04-15

1429

NL2SQL进阶系列(5)：论文解读业界前沿方案（DIN-SQL、C3-SQL、DAIL-SQL）、新一代数据集BIRD-SQL解读

书生·浦语大模型全链路开源体系（LLM/AGENT/多模态/应用部署）从入门到精通

熊猫小妖的AI世界

04-17

983

书生浦语LLM大模型教程

Go Wails 学习笔记：创建第一个项目

程序媛平平无奇的一天

10-14

1114

Wails 通过结合前端技术和 Go 后端，提供了一个高效的方式来开发跨平台的桌面应用。其简单的项目初始化和清晰的结构使得开发者能够快速上手。通过 Wails，可以充分利用 Web 开发技能，同时获得原生桌面应用的优势。

《vue leaflet学习实践笔记》

yk_ddm的博客

10-16

180

目录vue leaflet学习实践笔记 vue leaflet学习实践笔记

【Petri网导论学习笔记】Petri网导论入门学习（五）—— 1.3 库所/变迁系统与加权Petri网

【InternLM 实战营第二期】第五节 笔记

【InternLM 实战营第二期】第五节 笔记

第五节 LMDeploy 量化部署 LLM-VLM 实践

一、大模型部署背景

二、大模型部署方法

三、LMDeploy简介

【InternLM 实战营第二期】第五节笔记

【InternLM 实战营第二期】第五节笔记