剪枝与重参：剪枝引言

爱听歌的周童鞋

已于 2023-04-03 20:39:16 修改

阅读量1.5k

点赞数 1

分类专栏：剪枝与重参文章标签：模型剪枝模型重参数化深度学习

于 2023-04-03 20:36:02 首次发布

本博客上原创文章未经本人许可，不得用于商业用途。转载请注明出处，否则保留追究法律责任的权利

本文链接：https://blog.csdn.net/qq_40672115/article/details/129938864

版权

剪枝与重参专栏收录该内容

14 篇文章

订阅专栏

模型剪枝是减少深度学习模型大小和复杂度的技术，旨在提高效率和性能。其原因是应对大模型的计算和存储需求，以及在资源有限的设备上部署AI的需求。剪枝包括结构化和非结构化两种方式，常用算法涉及L1、L2正则化等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

剪枝引言

前言

手写AI推出的全新模型剪枝与重参课程。记录下个人学习笔记，仅供自己参考。

本次课程为引言，主要讲解剪枝的一些基础概念。

课程大纲可看下面的思维导图

在这里插入图片描述

1.What、Why and How

问题：什么是模型剪枝？为什么需要剪枝？如何去剪枝呢？

1.1 What

什么是深度学习模型剪枝？

模型剪枝(Model Pruning)指的是在训练好的模型上去除一些冗余或不必要的参数，以达到减小模型大小、提高模型推理速度、降低模型计算复杂度等目的的一种模型压缩技术。

1.2 Why

为什么要学习剪枝呢？

主要有以下三点原因：

Today’s AI is to BIG!
随着深度学习的发展，现代的神经网络变得越来越大，具有很高的复杂性和参数量。从Transformer的0.05B，GPT-3的170B到GPT-4的上万亿参数，这些庞大的模型需要巨大的计算资源来训练和运行。

Memory is Expensive
由于深度学习模型的复杂性和参数量增加，模型存储和推理变得昂贵

Embedding device
深度学习在嵌入式设备上的应用正在迅速增长，然而这些设备通常有非常有限的计算和存储资源

综上所述，模型剪枝是为了减小模型的规模和复杂性，从而提高模型的效率和性能，使得模型可以在资源受限的设备上运行。