利用Tensorrt实现int8量化

@BangBang

已于 2022-09-19 09:23:24 修改

阅读量1.8k

点赞数

分类专栏： object detection 模型部署文章标签： python 深度学习计算机视觉

于 2022-09-18 14:50:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38346042/article/details/126915228

版权

object detection 同时被 2 个专栏收录

该专栏为热销专栏榜第61名

146 篇文章 63 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

28 篇文章 27 订阅

订阅专栏

本文详细介绍了如何使用TensorRT进行int8量化，包括int8量化的优势和步骤，从导出ONNX文件到TensorRT模型的编译和推理。在编译过程中，通过设置BuilderFlag::kINT8进行int8量化，并自定义校准器类进行标定。在模型推理阶段，对输入图像进行预处理并执行推理，最后展示了完整的代码流程。

摘要由CSDN通过智能技术生成

1 介绍

1.1 int 8量化

int8量化是利用int8乘法替换float32乘法实现性能加速的一种方法

1.对于常规的模型有:y=kx+b,此时x,k,b都是float32,对于kx的计算使用float32的乘法
2.对于int8模型有:y=tofp32(toint8(k)toint8(x))+b,其中int8int8结果为int 16
3 因此int8模型解决的问题是如何将float32合理转换为int8（合理的方法包括：KL散度，重新训练等），使得精度损失最小
4 也因此，经过int8量化的精度也会受到影响：官方给出的参考值分类影响比较小1-2个点，检测器可能有3-5个点的降低，这只是参考值，实际情况需要根据自己的测试结果

1.2 int 8量化步骤

Tensorrt里面想要实现int8,主要分为以下4个步骤

1.配置setFlag，通过代码 nvinfer1::BuilderFlag::kINT8，指定BuilderFlag为kINT8,告诉编译器我们的编译模式是int8
2.实现Int8EntropyCalibrator类并继承

了解本专栏

超级会员免费看

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

@BangBang 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。