unet、yolo、resnet等神经网络模型蒸馏、剪枝、量化

最新推荐文章于 2025-02-27 11:12:02 发布

Jack dudu

最新推荐文章于 2025-02-27 11:12:02 发布

阅读量832

点赞数 4

分类专栏：炼金文章标签： YOLO 神经网络剪枝 pycharm 计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43576336/article/details/144735681

版权

炼金专栏收录该内容

6 篇文章

订阅专栏

神经网络模型蒸馏、剪枝、量化均属于对模型的大小进行缩减的方式，从而提高模型在有限硬件资源上的表现，例如将模型部署到树莓派、jetson-nano、tx2等微小型设备上，从而实现例如人脸检测、种类识别、车辆管理等应用。

模型蒸馏

蒸馏主要是利用教师网络模型来训练学生网络模型，其中教师网络模型是属于结构复杂、参数量巨大的模型，而与之相反，学生网络模型属于结构简单、参数量较小的。通过将教师端的模型经验输送给学生端，从而现实对教师端网络模型的蒸馏。
下面我们用一个实际例子来进行说明：（如果你能理解下面的内容，那么蒸馏的精髓也就理解了）
在HoVer-UNet中，学生网络的训练过程确实涉及到两个主要步骤：计算学生网络与真实标签之间的差异（学生损失），以及计算学生网络与教师网络预测结果之间的差异（蒸馏损失）。以下是详细的步骤：

学生损失（Student Loss）：

对于每一张输入图像，学生网络首先会进行前向传播，得到预测结果。然后，这个预测结果会与该图像的真实标签进行比较，计算出学生损失。这个损失反映了学生网络直接从数据中学习的效果

蒸馏损失（Distillation Loss）：

接着，教师网络（HoVerNet）对同一张图像进行预测。学生网络的预测结果会与教师网络的预测结果进行比较，计算出蒸馏损失。这个损失反映了学生网络与教师网络预测之间的差异，目的是让学生网络学习教师网络的知识

综合损失（Total Loss）：

最后，学生损失和蒸馏损失会根据一定的权重（通常用α表示）合并成一个综合损失。这个综合损失将指导学生网络的训练过程，使得学生网络不仅能够学习到如何准确预测，还能够模仿教师网络的行为

训练反馈：综合损失将被用来更新学生网络的权重，通过反向传播算法进行优化。这样，学生网络在训练过程中既能够学习到数据中的模式，又能够继承教师网络的知识

这个过程确保了学生网络在减少计算需求的同时，能够尽可能地保持教师网络的性能。通过这种方式，HoVer-UNet能够在保持高精度的同时，显著提高推理速度。

模型剪枝

网络剪枝（Network Pruning）：

通过删除神经网络中冗余的神经元或连接来减少模型的复杂度和计算量

权重剪枝（Weight Pruning）：

通过删除神经网络中冗余的权重来减少模型的复杂度和计算量

模型量化（Quantization）：

将神经网络中的权重和激活值从浮点数转换为低精度的整数表示，从而减少模型的存储空间和计算量，例如采用float16来替代float32，从而在量化程度上减小模型量。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。