模型剪枝介绍

最新推荐文章于 2024-10-29 09:37:36 发布

起落安妥

最新推荐文章于 2024-10-29 09:37:36 发布

阅读量461

点赞数 4

分类专栏：面试文章标签：剪枝算法机器学习

本文链接：https://blog.csdn.net/qq_43642885/article/details/140354729

版权

面试专栏收录该内容

26 篇文章 0 订阅

订阅专栏

Ref：https://www.cnblogs.com/the-art-of-ai/p/17500399.html

1、背景介绍

深度学习模型在图像识别、自然语言处理、语音识别等领域取得了显著的成果，但是这些模型往往需要大量的计算资源和存储空间。尤其是在移动设备和嵌入式系统等资源受限的环境下，这些模型的体积和计算复杂度往往成为了限制其应用的瓶颈。因此，如何在保持模型准确率的同时，尽可能地减少模型的体积和计算复杂度，成为了一个重要的研究方向。

模型剪枝技术就是解决这个问题的一种有效方法。它通过对深度学习模型进行结构优化和参数削减，使得模型在保持准确率的前提下，具有更小的体积和更快的运行速度，从而更好地适应不同的任务和环境。

2、基本原理

模型剪枝技术是指对深度学习模型进行结构优化和参数削减的一种技术。剪枝技术可以分为结构剪枝和参数剪枝两种形式。

结构剪枝是指从深度学习模型中删除一些不必要的结构单元，如神经元、卷积核、层等，以减少模型的计算复杂度和存储空间。常见的结构剪枝方法包括：通道剪枝、层剪枝、节点剪枝、过滤器剪枝等。

参数剪枝是指从深度学习模型中删除一些不必要的权重参数，以减少模型的存储空间和计算复杂度，同时保持模型的准确率。常见的参数剪枝方法包括：L1正则化、L2正则化、排序剪枝、局部敏感哈希剪枝等。

3、技术原理

模型剪枝技术的核心思想是在保持模型准确率的前提下，尽可能地减少模型的存储空间和计算复杂度。由于深度学习模型中的神经元、卷积核、权重参数等结构单元和参数往往存在冗余和不必要的部分，因此可以通过剪枝技术来减少这些冗余部分，从而达到减小模型体积和计算复杂度的效果。

具体来说，模型剪枝技术的实现可以分为以下几个步骤：

（1）初始化模型；首先，初始化一个深度学习模型并进行训练，获得一个基准模型；

（2）选择剪枝量化方法和策略；根据具体的应用场景和需求，选择合适的剪枝方法和策略；常见的简直方法包括：结构剪枝和参数剪枝；常见的策略包括：全局剪枝和迭代剪枝；

（3）剪枝模型；基于选择的剪枝方法和策略，对深度学习模型进行剪枝操作；具体来说删除一些不必要的结构单元和权重参数，或者将他们设置为0或者很小的值；

（4）重新训练模型；剪枝操作可能会导致模型的准确率下降；因此需要重新对剪枝后的模型进行训练；以恢复模型的准确率；

（5）微调模型;重新训练后，对模型进行微调；进一步提高模型的准确率；

代码：

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets, transforms

# 定义一个简单的卷积神经网络
class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 4, kernel_size=3, padding=1)  # 4个输出通道
        self.conv2 = nn.Conv2d(4, 8, kernel_size=3, padding=1)  # 8个输出通道
        self.fc1 = nn.Linear(8 * 7 * 7, 64)
        self.fc2 = nn.Linear(64, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))  # 卷积层1 + ReLU激活函数
        x = F.max_pool2d(x, 2)  # 最大池化层，池化核大小为2x2
        x = F.relu(self.conv2(x))  # 卷积层2 + ReLU激活函数
        x = F.max_pool2d(x, 2)  # 最大池化层，池化核大小为2x2
        x = x.view(x.size(0), -1)  # 展平操作，将多维张量展平成一维
        x = F.relu(self.fc1(x))  # 全连接层1 + ReLU激活函数
        x = self.fc2(x)  # 全连接层2，输出10个类别
        return x

# 实例化模型
model = SimpleCNN()

# 打印剪枝前的模型结构
print("Model before pruning:")
print(model)

# 加载数据
transform = transforms.Compose([
    transforms.ToTensor(),  # 转换为张量
    transforms.Normalize((0.1307,), (0.3081,))  # 归一化
])
train_dataset = datasets.MNIST('./data', train=True, download=True, transform=transform)  # 加载训练数据集
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)  # 创建数据加载器

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()  # 交叉熵损失函数
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam优化器

# 训练模型
model.train()  # 将模型设置为训练模式
for epoch in range(1):  # 训练一个epoch
    running_loss = 0.0
    for data, target in train_loader:
        optimizer.zero_grad()  # 清零梯度
        outputs = model(data)  # 前向传播
        loss = criterion(outputs, target)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新参数
        running_loss += loss.item() * data.size(0)  # 累加损失

    epoch_loss = running_loss / len(train_loader.dataset)  # 计算平均损失
    print(f'Epoch {epoch + 1}, Loss: {epoch_loss:.4f}')

# 通道剪枝
# 获取卷积层的权重
conv1_weights = model.conv1.weight.data.abs().sum(dim=[1, 2, 3])  # 计算每个通道的L1范数

# 按照L1范数对通道进行排序
sorted_channels = torch.argsort(conv1_weights)

# 选择需要删除的通道
num_prune = 2  # 假设我们要删除2个通道
channels_to_prune = sorted_channels[:num_prune]

print("Channels to prune:", channels_to_prune)

# 删除指定通道的权重和偏置
pruned_weights = torch.index_select(model.conv1.weight.data, 0, sorted_channels[num_prune:])  # 获取保留的权重
pruned_bias = torch.index_select(model.conv1.bias.data, 0, sorted_channels[num_prune:])  # 获取保留的偏置

# 创建一个新的卷积层，并将剪枝后的权重和偏置赋值给它
model.conv1 = nn.Conv2d(in_channels=1, out_channels=4 - num_prune, kernel_size=3, padding=1)
model.conv1.weight.data = pruned_weights
model.conv1.bias.data = pruned_bias

# 同时我们还需要调整conv2层的输入通道
# 获取conv2层的权重并调整其输入通道
conv2_weights = model.conv2.weight.data[:, sorted_channels[num_prune:], :, :]  # 调整输入通道的权重

# 创建一个新的卷积层，并将剪枝后的权重赋值给它
model.conv2 = nn.Conv2d(in_channels=4 - num_prune, out_channels=8, kernel_size=3, padding=1)
model.conv2.weight.data = conv2_weights

# 打印剪枝后的模型结构
print("Model after pruning:")
print(model)

# 定义新的优化器
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 重新训练模型
model.train()  # 将模型设置为训练模式
for epoch in range(1):  # 训练一个epoch
    running_loss = 0.0
    for data, target in train_loader:
        optimizer.zero_grad()  # 清零梯度
        outputs = model(data)  # 前向传播
        loss = criterion(outputs, target)  # 计算损失
        loss.backward()  # 反向传播
        optimizer.step()  # 更新参数
        running_loss += loss.item() * data.size(0)  # 累加损失

    epoch_loss = running_loss / len(train_loader.dataset)  # 计算平均损失
    print(f'Epoch {epoch + 1}, Loss: {epoch_loss:.4f}')

# 加载测试数据
test_dataset = datasets.MNIST('./data', train=False, transform=transform)  # 加载测试数据集
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=1000, shuffle=False)  # 创建数据加载器

# 评估模型
model.eval()  # 将模型设置为评估模式
correct = 0
total = 0
with torch.no_grad():  # 关闭梯度计算
    for data, target in test_loader:
        outputs = model(data)  # 前向传播
        _, predicted = torch.max(outputs.data, 1)  # 获取预测结果
        total += target.size(0)  # 总样本数
        correct += (predicted == target).sum().item()  # 正确预测的样本数

print(f'Accuracy: {100 * correct / total}%')  # 打印准确率

为了提高剪枝技术的性能和效率，可以考虑以下几个方面的优化：