模型压缩和加速,量化

本文探讨了深度学习模型的加速方法,包括CNN加速、结构化简化和通道剪枝。量化是关键策略,如二值化和三值化网络,以减少计算资源需求。特别是int8量化,适用于模型压缩和推理加速,尤其在移动端设备上。量化流程包括训练后的量化和量化感知训练。
摘要由CSDN通过智能技术生成

本质:

1)量化对象: 1、各层特征图 (通过统计其值分布进行量化)   2、每层卷积核(通过参数分布进行量化)

2)bias 可去掉的理论依据: 利用对称量化(卡阈值,令其正负两端都是该值),使其关于中心点对齐。

 

 

1.方案介绍

 

2、总结方法:

量化方式: 二值化网络,三值化网络,深度压缩

深度压缩包括(针对Alexnet ,VGG这种冗余的网络来说效果不错,但对于squeezenet,mobilenet 来说效果不佳):

1) 剪枝: 参数小于阈值的归0

               难点: 由于剪枝是将参数彻底抛弃,因此,剪掉权重不再接受任何的梯度。从而使得网络参数变成一个稀疏矩阵。

                            在训练过程中,由于小参数不断被剪枝,为了持续增大压缩率,阈值的设定必须不断增大(引出了一个算法,基于准确率损失和压缩率上升的公式)

 

2)量化 :将接近的值变成一个数。高度稀疏化后我们还可以对非零参数进行定点压缩。

 

二值化网络:

Float 32 ——> 正负1  : 

<
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值