接 LLM大模型剪枝篇,开启LLM端侧小模型篇的极致0成本部署之路~!!!! 剪枝效果 量化效果 推理框架 MLC-LLM:编译器方式推理,跨平台可用推理框架 https://huggingface.co/mlc-ai