yolov5的ptq量化流程

最新推荐文章于 2024-05-07 16:03:40 发布

ghx3110

最新推荐文章于 2024-05-07 16:03:40 发布

阅读量312

点赞数

分类专栏： yolov5/yolov8的量化部署文章标签： YOLO 目标检测算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41920323/article/details/134148589

版权

yolov5/yolov8的量化部署专栏收录该内容

53 篇文章 120 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了基于YOLOv5n模型的Post-Training-Quantization（PTQ）过程，包括加载模型、插入Q/DQ节点、选择量化方法、手动替换算子、敏感层分析和校准模型等步骤。通过PTQ，模型被转换为INT8精度，但小模型可能存在精度损失。文章还提到了如何根据敏感层分析结果调整量化策略。

摘要由CSDN通过智能技术生成

本次试验是基于yolov5n的模型进行ptq、qat的量化以及敏感层分析的试验。
Post-Training-Quantization（PTQ）是目前常用的模型量化方法之一。以INT8量化为例，PTQ处理流程如下：

首先在数据集上以FP32精度进行模型训练，得到训练好的baseline模型；
使用小部分数据对FP32 baseline模型进行calibration（校准），这一步主要是得到网络各层weights以及activation的数据分布特性（比如统计最大最小值）；
根据2.中的数据分布特性，计算出网络各层、量化参数；
使用3.中的量化参数对FP32 baseline进行量化得到INT8模型，并将其部署至推理框架进行推理；

PTQ方式会使用小部分数据集来估计网络各层weights和activation的数据分布，找到合适的Scale，从而一定程度上降低模型精度的损失。

然而，PTQ方式虽然在大模型上效果较好（例如ResNet101），但是在小模型上经常会有较大的精度损失（例如MobileNet），同时不同层对于精度的影响也比较大。

接下来本文结合代码，来讲解如何使用torch_quant来对yolov5n进行ptq量化。
本次内容的代码主要是下图1中的这四个文件，下篇文章会放整体代码的下载链接。
图1：
在这里插入图片描述

了解本专栏

超级会员免费看

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
2
评论
yolov5的ptq量化流程

yolov5的ptq和qat量化流程讲解
复制链接

扫一扫

专栏目录

ghx3110

CSDN认证博客专家 CSDN认证企业博客

码龄6年

149: 原创

1904: 周排名

1万+: 总排名

9万+: 访问

: 等级

2531: 积分

4800: 粉丝

870: 获赞

112: 评论

930: 收藏

私信

关注

热门文章

分类专栏

最新评论

YOLOv5改进之OTA、SimOTA
ghx3110: 两个都没变化么？换一下v5的版本试试看
YOLOv5改进之OTA、SimOTA
m0_47082393: 为什么修改后，模型学习不到东西，map一直是0
YOLOv8的特征蒸馏代码应用讲解（CWD/MGD/mimic/在线蒸馏/逻辑蒸馏）
ghx3110: 可以试试mgd，相比cwd，mgd效果更好一点，具体效果，需要根据自己的数据集调整验证
C++之：struct和class的区别
涛涛ALG: 单结构体大小计算规则：规则1：找到当前结构体中，存储空间最大的单元，所有空间都按照这个最大单元的大小存储。注意：上一句话所说的是空间而不是存储单位规则2：所有单位按照顺序进行存储，如果多个单位可以合并为一个空间，则合并存储
YOLOv8的特征蒸馏代码应用讲解（CWD/MGD/mimic/在线蒸馏/逻辑蒸馏）
dzh88776078: 你好，我用你的框架对yolov8L（map50是0.825）模型蒸馏，student模型是s模型，蒸馏训练后map50是0.806，但是如果我直接训练yolov8s，map50有0.815，用的是cwd+offline,有什么建议吗

最新文章

2024

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ghx3110 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。