tensorrt-int8量化介绍

最新推荐文章于 2024-08-03 03:23:30 发布

hello_dear_you

最新推荐文章于 2024-08-03 03:23:30 发布

阅读量4k

点赞数 7

分类专栏： # tensorrt 文章标签： python 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hello_dear_you/article/details/110733846

版权

tensorrt 专栏收录该内容

10 篇文章 9 订阅

订阅专栏

0. 背景-为什么要做量化

尽管近几年来，模型的size在不断的压缩，但是计算量（通常几百MFLOPs左右）对于移动端还是很大。由于每个层的权重参数范围基本确定（BatchNorm），且波动不大，适合量化压缩。量化能减少访存和计算量。

1. 量化的原理

1.1 量化本质

1.2 量化原理-最大值映射

1.3 饱和截断映射

2. TensorRT的INT8量化

2.1 模型选择

2.2 工作流程

3. 基于TensorRT的Python API实例

3.1 需要注意的点

3.2 校准器类分析

4. 其他

4.1 参考文章

INT8量化介绍：https://zhuanlan.zhihu.com/p/58182172

INT8量化原理问题记录：https://www.cnblogs.com/deepllz/p/11672912.html

TensorRT的mixed precision：https://docs.nvidia.com/deeplearning/tensorrt/archives/tensorrt-700/tensorrt-developer-guide/index.html#mixed_precision

讨论：

https://blog.csdn.net/yangjf91/article/details/92794182

4.2 相关项目

TensorRT的sample:

Python版本: caffe_int8_mnist

C++版本： sampleINT8

Github的sample:

Yolov3-onnx-int8: https://github.com/mynotwo/yolov3_tensorRT_int8_calibration（这个项目的int8量化没跑通，自己改了一下）

Yolov3和v4: https://github.com/jkjung-avt/tensorrt_demos#int8_and_dla（重点推荐）

4.3 错误分析

Calibrator构建错误

https://forums.developer.nvidia.com/t/int8-calibration-meet-error-get-batch-takes-2-positional-arguments-but-3-were-given/75106

Yolov3和Yolov4

https://forums.developer.nvidia.com/t/migrating-int8-calibration-from-tensorrt-6-to-tensorrt-7-in-yolov3-and-yolov4-failed/148950/3

目标检测推理-int8 vs float32精度

https://forums.developer.nvidia.com/t/tensorrt-4-0-1-int8-precision-vs-fp32-precision-objects-detections-inference-results/83864

Tensorrt5-C++

https://forums.developer.nvidia.com/t/how-to-do-int8-calibration-in-c-in-tensorrt-5/71556

以上是我做tensorrt的int8过程中的一些总结和资料，希望能有所帮助

关注

7
点赞
踩
35

收藏

觉得还不错? 一键收藏
13
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hello_dear_you CSDN认证博客专家 CSDN认证企业博客

码龄10年

111: 原创

4万+: 周排名

24万+: 总排名

30万+: 访问

: 等级

2139: 积分

291: 粉丝

456: 获赞

223: 评论

1834: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Milvus的以文搜图】
2301_76558246: 请问mivlus部分有完整的代码吗？
ViTDet论文笔记
kikojh: 哪里可以找到MAE 预训练模型
C/C++调用python
wlbpl: 你好，当使用你所提供的代码调用python模块中的函数时，出现“ModuleNotFoundError: No module named 'my_module2'”，所以我想问一下在调用python函数的时候，需要把python模块放在c++项目路径下吗？
U-Net基于TensorRT部署
wxn1229: 請問您是用trtexec 來轉換 onnx 為 trt 嘛
U-Net基于TensorRT部署
jzdl: state_dict = torch.load(model_file) mask_values = state_dict.pop('mask_values', [0, 1])

最新文章

目录

评论 13

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。