在移动设备上实时执行的DNN权重修剪中缺失但令人满意的稀疏性

最新推荐文章于 2023-11-17 17:24:52 发布

92年的研究员

最新推荐文章于 2023-11-17 17:24:52 发布

阅读量683

点赞数

分类专栏：模型压缩文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/dingyustefan/article/details/107455766

版权

本文介绍了一种新的深度神经网络(DNN)权重修剪方法PCONV，它结合了结构化和非结构化剪枝的优势，实现了在移动设备上高精度和实时推理。通过模式剪枝和连接剪枝，PCONV创建了一种新的稀疏维度，既保持了精度，又提高了硬件效率。实验表明，PCONV在TensorFlow-Lite, TVM和阿里巴巴移动神经网络上分别实现了39x, 11x, 6x的加速，无精度损失。" 96475692,7968363,数据挖掘建模全解析：从目标定义到模型优化,"['数据挖掘', '算法流程', '模型构建', '数据质量分析', '对比分析']

摘要由CSDN通过智能技术生成

本篇文章是记录的是对PCONV: The Missing but Desirable Sparsity in DNN Weight Pruning forReal-time Execution on Mobile Devices的学习。为对人工智能，深度学习等领域有兴趣的同学提供参考和学习，内容如有不当请联系作者进行改进，互相学习。

该篇文章主要介绍了针对当前流行的剪枝手段的两个极端：结构化剪枝（精度不高，对硬件设备友好）和非结构化剪枝（精度高，对硬件设备不友好，推理消耗时间）。分析两种剪枝方案的优缺点并结合两种剪枝方案的优点，设计出在算法层面和硬件编译阶段进行优化的一种新的剪枝方案和推理优化方案，该方案能够在移动设备上实时推理。

原论文地址：《PCONV: The Missing but Desirable Sparsity in DNN Weight Pruning forReal-time Execution on Mobile Devices》

摘要：在深度神经网络中模型压缩技术是一种有效的在各类平台上实现加速，深度神经网络模型剪枝是一个直接和高效的方法。当前有两种主要的修剪方式代表修剪规则的两个极端：结构化修剪--精细化剪枝能够实现高稀疏性和高精确度，但是对硬件不友好。结构化剪枝--粗粒度修剪利用了硬件效率高的结构，但当修剪率很高时，准确性会下降。针对以上文章提出了PCONV-一种新的稀疏维度压缩方案------粗粒度修剪结构中的细粒度模式剪枝。PCONV结合了两种稀疏类型，由内部

最低0.47元/天解锁文章

92年的研究员

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
在移动设备上实时执行的DNN权重修剪中缺失但令人满意的稀疏性

本篇文章是记录的是对PCONV: The Missing but Desirable Sparsity in DNN Weight Pruning forReal-time Execution on Mobile Devices的学习。为对人工智能，深度学习等领域有兴趣的同学提供参考和学习，内容如有不当请联系作者进行改进，互相学习。该篇文章主要介绍了针对当前流行的剪枝手段的两个极端：结构化剪枝（精度不高，对硬件设备友好）和非结构化剪枝（精度高，对硬件设备不友好，推理消耗时...
复制链接

扫一扫