LMDeploy量化部署LLM-VLM实践课程笔记
大模型面临的挑战
-
参数量巨大
-
访问瓶颈及动态请求
优化方法:
-
模型减枝 (减少模型参数)
-
知识蒸馏(减少模型参数)
-
模型量化(将浮点数转化为整数)
LMDeploy简介:
-
lmdeploy核心功能
-
性能对比
实战部分随后见作业
大模型面临的挑战
参数量巨大
访问瓶颈及动态请求
优化方法:
模型减枝 (减少模型参数)
知识蒸馏(减少模型参数)
模型量化(将浮点数转化为整数)
LMDeploy简介:
lmdeploy核心功能
性能对比
实战部分随后见作业