模型部署与剪枝实践
什么是finetune?
微调指的是在给定一些初始参数的情况下,训练模型。
什么是模型推理?
模型推理是在用模型了,而不是在训练模型
模型推理:模型真正使用的时候,输入需要输入的,然后看结果。
一、模型部署 量化与剪枝
pytorch模型转为onnx
如何看权重参数分布图
3
#一、 结构化模型剪枝(基于权重的方法:根据权重大小进行剪枝、基于激活值的方法:根据激活比例的幅值大小来剪枝)
1、基于激活值的稀疏性的意思是统计每一层激活值为0的比例
PoZ:概率of zero,即激活的比例。
APoZ对每一层可以统计对每一个通道可以做统计。
激活值趋近于0就说明这个神经元无效的,是死掉了的神经元,越在深层无效神经元越有可能。
APoC越大的话,说明0值越大,说明