ch5-LMDeploy大模型量化部署实践

主要内容

  • 视频网址:https://www.bilibili.com/video/BV1iW4y1A77P/?spm_id_from=333.788&vd_source=b96c7e6e6d1a48e73edafa36a36f1697
  • 教程主页:https://github.com/InternLM/tutorial
  • LMDeploy主页:https://github.com/InternLM/lmdeploy

主要内容如下:

基本就是对大模型部署的定义、特点、挑战以及部署方案进行了简单的介绍,主打一个了解就好,还是得靠动手实践,再回来慢慢看理论理解~
请添加图片描述

大模型部署背景

首先简单介绍了大模型部署的定义以及大模型的特点:
请添加图片描述
然后针对大模型的这三个典型特点,引出了大模型部署的挑战和方案介绍:
请添加图片描述

LMDeploy简介

  • LMDeploy主页:https://github.com/InternLM/lmdeploy

底层是用C++写的,接口支持python,very nice
请添加图片描述
官方秀了一下推理性能:
请添加图片描述

第一个核心功能:量化

请添加图片描述
请添加图片描述
请添加图片描述

第二个核心功能:推理引擎TurboMind

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

第三个核心动能:推理服务api server

请添加图片描述

动手实践环节

动手实践请详见下期博客作业完成情况~

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值