计算机视觉+人工智能面试笔试总结——卷积网络压缩面试题

最新推荐文章于 2023-12-27 17:57:17 发布

fpga和matlab

最新推荐文章于 2023-12-27 17:57:17 发布

阅读量946

点赞数 1

CC 4.0 BY-SA版权

分类专栏： ★求职1:深度学习/FPGA/机器视觉/算法手撕代码文章标签：人工智能计算机视觉面试职场和发展

本文链接：https://blog.csdn.net/ccsss22/article/details/126614429

★求职1:深度学习/FPGA/机器视觉/算法手撕代码专栏收录该内容

127 篇文章 ¥39.90 ¥99.00

订阅专栏

本文总结了卷积网络的压缩方法，包括前端压缩（知识蒸馏、滤波器剪枝）和后端压缩（低秩近似、参数量化、二值化网络）。讨论了低秩近似降低计算开销，剪枝算法衡量神经元重要性，参数量化减少存储开销，以及二值化网络的训练策略。强调了二值网络设计的注意事项，如避免1x1卷积和合理调整激活位数。最后提到了浅层/轻量网络在特定任务中的应用。

1.卷积网络的压缩方法

在一定程度上，网络越深，参数越多，模型越复杂，其最终效果越好。神经网络的压缩算法是，旨在将一个庞大而复杂的预训练模型（pre-trained model）转化为一个精简的小模型。
按照压缩过程对网络结构的破坏程度，我们将模型压缩技术分为“前端压缩”和“后端压缩”两部分。

+ 前端压缩，是指在不改变原网络结构的压缩技术，主要包括`知识蒸馏`、紧凑的模型结构涉及以及`滤波器（filter）层面的剪枝（结构化剪枝）`等；
+ 后端压缩，是指包括`低秩近似`、未加限制的剪枝（非结构化剪枝/稀疏）、`参数量化`以及二值网络等，目标在于尽可能减少模型大小，会对原始网络结构造成极大程度的改造。

总结：前端压缩几乎不改变原有网络结构（仅仅只是在原模型基础上减少了网络的层数或者滤波器个数），后端压缩对网络结构有不可逆的大幅度改变，造成原有深度学习库、甚至硬件设备不兼容改变之后的网络。其维护成本很高。