万字长文-深度学习模型压缩和加速-量化、剪枝、蒸馏等

谢杨易

已于 2024-05-29 14:48:49 修改

阅读量1.8w

点赞数 6

分类专栏：深度学习：搜索推荐、NLP、机器学习等文章标签：深度学习神经网络

于 2020-04-30 22:37:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013510838/article/details/105870545

版权

深度学习：搜索推荐、NLP、机器学习等专栏收录该内容

61 篇文章 87 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细探讨了深度学习模型在移动端的压缩和加速技术，包括结构优化（如矩阵分解、权值共享、分组卷积等）、量化、剪枝和蒸馏。通过这些方法，可以显著减小模型尺寸、降低计算复杂度，以适应移动端的资源限制。同时，文章还讨论了框架层和硬件层的加速策略，以实现更好的性能和效率。

摘要由CSDN通过智能技术生成

系列文章，请多关注
NLP预训练模型1 – 综述
 NLP预训练模型2 – BERT详解和源码分析
 Transformer家族1 – Transformer详解和源码分析

请添加图片描述

1 背景

近年来深度学习模型在计算机视觉、自然语言处理、搜索推荐广告等各种领域，不断刷新传统模型性能，并得到了广泛应用。随着移动端设备计算能力的不断提升，移动端AI落地也成为了可能。相比于服务端，移动端模型的优势有：

减轻服务端计算压力，并利用云端一体化实现负载均衡。特别是在双11等大促场景，服务端需要部署很多高性能机器，才能应对用户流量

了解本专栏

超级会员免费看

关注

6
点赞
踩
35

收藏

觉得还不错? 一键收藏
打赏
7
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

谢杨易 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。