目录
非结构化剪枝:SparseGPT,LoRAPrune,Wanda
非结构化剪枝:SparseGPT,LoRAPrune,Wanda
指移除个别参数,而不考虑整体网络结构。这种方法通过将低于阈值的参数置零的方式对个别权重或神经元进行处理。
结构化剪枝:LLM-Pruner
根据预定义规则移除连接或分层结构,同时保持整体网络结构。这种方法一次性地针对整组权重,优势在于降低模型复杂性和内存使用,同时保持整体的LLM结构完整。
pytorch基于卷积层通道剪枝的方法
原文: