模型量化(7):Yolov5 QAT量化训练

@BangBang

已于 2023-12-28 20:55:37 修改

阅读量3.4k

点赞数 3

CC 4.0 BY-SA版权

分类专栏：模型轻量化文章标签： YOLO 深度学习人工智能

于 2023-03-21 22:05:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38346042/article/details/129654443

模型轻量化专栏收录该内容

49 篇文章 ¥89.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了模型量化中的QAT（量化感知训练）方法，特别是在YOLOv5-nano模型上的应用。QAT首先在FP32精度下训练模型，然后插入伪量化节点，进行量化感知训练，以提升量化后的模型精度。相比于PTQ，QAT能更好地保持模型性能，但需要额外的训练步骤。文章详细阐述了QAT的流程、精度提升、与PTQ的优缺点对比，并提供了环境安装和代码实现的指导。

文章目录

1. QAT介绍

从模型量化(5): 敏感层分析可以看出来，对于yolov5-nano模型，对最后一层detect层进行敏感层分析的时候,发现对检测精度的影响比较大。所以在PTQ/QAT在进行量化时，会跳过这些敏感层。

QAT微调的模型，就是PTQ在校准后的模型。从上一小节可以看出如果PTQ中模型训练和量化是分开的，而QAT则是在模型训练时加入了伪量化节点，用于模拟模型量化时引起的误差。

1.1 QAT处理流程

1. 首先在数据集上以FP32精度进行模型训练，得到训练好的baseline模型；
1. 在baseline模型中插入伪量化节点，
1. 进行PTQ得到PTQ后的模型；
<

了解本专栏

超级会员免费看

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

@BangBang 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。