网络的压缩与加速原理

最新推荐文章于 2023-07-03 19:49:52 发布

s123l4

最新推荐文章于 2023-07-03 19:49:52 发布

阅读量323

点赞数

分类专栏：深度学习和行人重识别文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/s123l4/article/details/106684974

版权

深度学习和行人重识别专栏收录该内容

10 篇文章 6 订阅

订阅专栏

模型压缩与加速概述

必要性、可行性
最终目的：最大程度的减小模型复杂度，减少模型存储需要的空间，也致力于加速模型的训练和推测。
方法概述：前端压缩、后端压缩（极大改造网络结构）

前端压缩

知识蒸馏

采用的是迁移学习，通过预先训练好的教师模型的输出作为监督信号去训练另外一个轻量化网络。
在这里插入图片描述
监督的信息可分为：概率分布、输出的特征、中间层feature map、Attention map|、中间过程

概率分布——KL散度
KL散度，是描述两个概率分布P和Q差异的一种方法，它是非对称的。
在这里插入图片描述
Feature Map——MMD Loss
用最大均值差异损失（MMD Loss）来评估两个域的相似性

中间过程——L2损失
利用Gram矩阵来拟合层与层之间的关系，然后用l2损失函数来比较教师与学生的gram矩阵。

紧致的网络结构设计

直接设计又小又快又好的网络，这就是紧致网络设计
常见的紧致网络：ShuffleNet、MobileNet v1、MobileNet v1、SqueezeNet

后端压缩

低秩压缩

卷积分解：将dd卷积核分解为d1和1*d卷积核，损失精度小于1%
SVD分解：对矩阵进行SVD分解，仅保留特征值大的几项

剪枝

网络训练完成后，裁剪掉贡献信息量不大的网络参数。
在这里插入图片描述
剪枝方法分类：权重衰减法、灵敏度量化法、根据相关性剪枝

量化

神经网络模型的参数不需要保留很高的精度，通过牺牲精度来降低所占的空间。
量化的对象有：网络权值、网络特征、网络梯度

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。