30.深度学习模型压缩方法-4

最新推荐文章于 2023-07-18 17:57:08 发布

大勇任卷舒

最新推荐文章于 2023-07-18 17:57:08 发布

阅读量917

点赞数

分类专栏：深度学习文章标签：深度学习人工智能

@大勇若怯任卷舒

本文链接：https://blog.csdn.net/m0_47454596/article/details/128410394

版权

66 篇文章 0 订阅 ¥19.90 ¥99.00

订阅专栏

基于低秩分解的深度神经网络压缩与加速的核心思想是利用矩阵或张量分解技术估计并分解深度模型中的原始卷积核
- 卷积计算是整个卷积神经网络中计算复杂度最高的计算操作，通过分解４Ｄ卷积核张量，可以有效地减少模型内部的冗余性
- 此外对于２Ｄ的全连接层矩阵参数，同样可以利用低秩分解技术进行处理
- 但由于卷积层与全连接层的分解方式不同，本文分别从卷积层和全连接层２个不同角度回顾与分析低秩分解技术在深度神经网络中的应用
从理论上利用低秩分解的技术并分析了深度神经网络存在大量的冗余信
息，开创了基于低秩分解的深度网络模型压缩与加速的新思路
- 如图所示，展示了主流的张量分解后卷积计算

评价指标	特点
准确率	目前,大部分研究工作均会测量 Top-1 准确率,只有在 ImageNet 这类大型数据集上才会只用 Top-5 准确率.为方便比较
参数压缩率	统计网络中所有可训练的参数,根据机器浮点精度转换为字节(byte)量纲,通常保

了解本专栏

关注

专栏目录