LMDeploy大模型量化部署实践 1、大模型部署背景 2、LMDeploy简介 2.1、LMDeploy简介 2.2、推理性能 2.3、核心功能–量化 2.4、核心功能–推理引擎TurboMind 2.4、核心功能–推理服务api server