目录
5.1 量化训练(Quant Aware Training, QAT)
[伪量化节点(fake quant)](https://blog.csdn.net/qq_51175703/article/details/138320834?spm=1001.2014.3001.5502#伪量化节点(fake quant))
5.2 动态离线量化(Post Training Quantization Dynamic, PTQ Dynamic)
5.3 静态离线量化(Post Training Quantization static, PTQ Static)
2.1 Unstructured Pruning(非结构化剪枝 )
3.1 训练一个模型 ->对模型进行剪枝 -> 对剪枝后模型进行微调
3.2 在模型训练过程中进行剪枝 -> 对剪枝后模型进行微调
大模型之大模型压缩(量化、剪枝、蒸馏、低秩分解),推理(vllm)
最新推荐文章于 2025-04-12 11:39:36 发布