第2节中的每一小节在未来都有进一步发展的潜力。此外,结构化修剪将继续借用非结构化修剪的思想
剪枝理论
除了在第2.4节中使用优化工具进行修剪外,一些工作还从synaptic flow突触流[179]、signal propagation信号传播[180]和图论[181]的角度看待修剪。此外,修剪过程可以通过利用模型[182]、loss landscape损失景观[110]、generalizationstability trade-off可推广性权衡[183]和模型熵[184]的解释来指导。此外,使用对数修剪[185]研究了LTH背后的理论。此外,不同的训练方法[186]、[187]、[188]可以与修剪一起考虑。上述方向在结构修剪方面具有潜力。
剪枝机制
研究人员对流行的三阶段训练-修剪-再训练机制有了新的看法。首先,彩票假说是在非结构化修剪上提出的,有望扩展到结构化修剪上。其次,单次修剪[189],[190]只修剪一次,得到修剪后的模型。结构化修剪可能从这种机制中受益。第三,AC/DC训练[191]能够对密集和稀疏模型进行联合训练。因此,在修剪和训练过程中处理多个模型是结构化修剪的另一个有希望的方向。
剪枝率和剪枝域
结构化修剪也可以扩展当前的权重修剪策略来研究分层修剪比率[192],[193]。利用frequency domain频域[64]、[194]中的表示来指导修剪是另一个有趣的方向
特定任务的剪枝
剪技术可以应用于其他任务以实现高计算效率。这里有一些简单的例子:超分辨率[202]、个人识别[203]、医学成像诊断[204]、人脸属性分类[205]和集成学习[206],[207]。除了上述任务外,还有一些新兴的方向仍处于早期阶段,但在未来很有希望
特定网络的剪枝
除了主要的神经网络外,对其他类型的神经网络剪枝也是有效的,如MLP,GAN,Transformers,Artificial general intelligence (AGI)