第5节作业

最新推荐文章于 2024-08-08 23:23:47 发布

tuyihan

最新推荐文章于 2024-08-08 23:23:47 发布

阅读量546

点赞数 13

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tuyihan/article/details/136790834

版权

0. 作业截图

命令行生成小说
在这里插入图片描述

在这里插入图片描述

TurboMind推理+API服务
在这里插入图片描述

ssh隧道端口转发后

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

1. 动手时间 —— 安装部署量化

在这里插入图片描述

在这里插入图片描述
可以直接启动本地的 Huggingface 模型，如下所示

lmdeploy chat turbomind /share/temp/model_repos/internlm-chat-7b/  --model-name internlm-chat-7b

在这里插入图片描述

离线转换
在这里插入图片描述
TurboMind 推理+命令行本地对话

2. 课程笔记

LMDeploy 部署实战

采用内自回归生成Token, 需要缓存 Attention 的 k/v ，带来巨大的内存开销
动态shape，请求数不固定，Token逐个生成数量不定
LLM结构简单，大部分是 Decoder-Only

在这里插入图片描述

带来的挑战

在这里插入图片描述
LMDeploy

大语言模型在英伟达设备上的部署

在这里插入图片描述

在这里插入图片描述
计算密集 + 访存密集两种

在这里插入图片描述
AWQ算法 <> GPTQ算法(之前的sota), 前者推理速度快，量化时间短
kv-cache int8 量化

推理引擎 turboMind 做了非常多的优化
在这里插入图片描述

Continuous Batch 持续批处理
有状态推理，需要用户每次带上对话记录
分块的 kv cache，支持不连续的 k/v
高性能的 cuda kernel （flash attention 2, w4a16, 反量化 kernel）

Continuous Batch，主要是一个持续的批处理
在这里插入图片描述

server端帮你存上下文，不需要用户去带
在这里插入图片描述

在这里插入图片描述

推理服务API SERVER

模型列表和 openai 是一致的

关注

13
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
第5节作业

AWQ算法 <> GPTQ算法(之前的sota), 前者推理速度快，量化时间短。可以直接启动本地的 Huggingface 模型，如下所示。Continuous Batch，主要是一个持续的批处理。推理引擎 turboMind 做了非常多的优化。server端帮你存上下文，不需要用户去带。TurboMind 推理+命令行本地对话。kv-cache int8 量化。推理服务API SERVER。LMDeploy 部署实战。计算密集 + 访存密集两种。ssh隧道端口转发后。
复制链接

扫一扫

tuyihan CSDN认证博客专家 CSDN认证企业博客

码龄1年

21: 原创

146万+: 周排名

8万+: 总排名

5919: 访问

: 等级

310: 积分

57: 粉丝

100: 获赞

15: 评论

61: 收藏

私信

关注

热门文章

最新评论

隐私计算第一期数据可信流通，从运维信任到技术信任
CSDN-Ada助手: 恭喜用户第20篇博客发布成功！标题中提到的隐私计算和数据可信流通是当下技术领域的热点话题，您的文章一定对读者有很大的启发和帮助。希望您能继续保持创作的热情和精神，探索更深层次的技术内容，为读者带来更多的价值和启发。祝您在未来的创作中不断进步，谦卑地表达自己的见解，让更多的人受益于您的分享！
第二节作业
CSDN-Ada助手: 恭喜你完成了第二篇博客！持续创作是非常不易的，你的努力和坚持让我十分钦佩。接下来，我建议你可以尝试挑战一些不同类型或者更深入的话题，让读者更加期待你的作品。加油！期待你的下一篇作品。
第三节作业
CSDN-Ada助手: 恭喜您发布了第三节作业！坚持创作是非常了不起的，您的努力和坚持定会有所回报。接下来，建议您可以尝试更多不同的题材和风格，挑战自己，不断突破自己的创作边界。期待您的更多精彩作品！加油！
第4节作业
CSDN-Ada助手: 恭喜您完成了第16篇博客《第4节作业》，持续创作是非常了不起的事情！您的努力和坚持让我十分钦佩。接下来，或许可以考虑扩大一下话题范围，尝试一些新的写作风格，让读者有更多的惊喜和启发。期待您的下一篇作品，继续为我们带来更多精彩内容！祝您写作顺利，创意无限！
第5节作业
CSDN-Ada助手: 恭喜您写完了第17篇博客《第5节作业》，不断坚持创作是非常了不起的事情。希望您能继续保持这样的创作热情，不断提升自己的写作水平。或许下一步可以尝试探索更多不同题材的内容，拓宽自己的写作视野，让读者在您的博客中获得更多启发和乐趣。期待您更多精彩的作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。