神经网络压缩联合优化方法的研究综述

最新推荐文章于 2024-07-26 13:24:37 发布

罗思付之技术屋

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量25

点赞数

分类专栏：网络通信安全及科学技术专栏文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fzq0625/article/details/138401983

版权

网络通信安全及科学技术专栏专栏收录该内容

86 篇文章 0 订阅 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

摘要: 随着人工智能应用的实时性、隐私性和安全性需求增大，在边缘计算平台上部署高性能的神经网络成为研究热点。由于常见的边缘计算平台在存储、算力、功耗上均存在限制，因此深度神经网络的端侧部署仍然是一个巨大的挑战。目前，克服上述挑战的一个思路是对现有的神经网络压缩以适配设备部署条件。现阶段常用的模型压缩算法有剪枝、量化、知识蒸馏，多种方法优势互补同时联合压缩可实现更好的压缩加速效果，正成为研究的热点。本文首先对常用的模型压缩算法进行简要概述，然后总结了“知识蒸馏+剪枝”、“知识蒸馏+量化”和“剪枝+量化”3种常见的联合压缩算法，重点分析论述了联合压缩的基本思想和方法，最后提出了神经网络压缩联合优化方法未来的重点发展方向。

关键词:
神经网络 /
压缩 /
剪枝 /
量化 /
知识蒸馏 /
模型压缩 /
深度学习

深度神经网络已经被成功应用在计算机视觉、自然语言处理等任务中，并在特定应用场景中取得了超越人类水平的成功。随着深度神经网络模型层数的加深、参数量的剧增，其计算复杂度也在不断增加，这不但会导致推理速度变慢，而且在运行时会带来巨大的功耗。如果需要实现模型在工业界的应用落地，则大多只能在存储容量大、算力充足、供电稳定的服务器、工作站甚至数据中心部署，然而这会带来网络延迟问题、数据隐私安全问题以及硬件成本问题，因此对神经网络压缩以实现端侧部署的研究意义重大。

移动互联网的发展使得移动端设备得到了广泛的普及与应用，正成为人类日常生活不可或缺的一部分。人脸

了解本专栏

超级会员免费看

罗思付之技术屋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
神经网络压缩联合优化方法的研究综述

神经网络轻量化的方法有直接设计轻量级网络和压缩现有的神经网络模型2种思路。直接设计轻量级网络分为人工设计轻量级网络模型和基于神经网络架构搜索(neural architecture search , NAS)的自动化神经网络架构设计。人工设计轻量级神经网络的思路是设计更加高效的卷积计算方式、构造更高效的神经网络结构，如谷歌采用深度可分离卷积替代传统卷积提出了MobileNet v1[4。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

罗思付之技术屋 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。