onnx 模型转换成 TensorRT 模型时, INT64 cast down to INT32 问题

xxLearn

于 2024-06-18 21:10:30 发布

阅读量693

点赞数 3

分类专栏：开发工具相关文章标签： python 视觉检测图像处理 YOLO c++

本文链接：https://blog.csdn.net/tyq64/article/details/139781585

版权

开发工具相关专栏收录该内容

4 篇文章 0 订阅

订阅专栏

问题

在用 onnx 模型转换成 TensorRT 模型时，输出以下警告：

[W] [TRT] onnx2trt_utils.cpp:366: Your ONNX model has been generated with INT64 weights, while TensorRT does not natively support INT64. Attempting to cast down to INT32.

原因

TensorRT 不支持 INT64 格式的权重，只支持 INT32 格式的权重，所以抛出了这个警告。

有无影响

如果只有这个警告，没有出现什么错误，那么没有影响，参考：
链接: link
在这里插入图片描述

链接: link
在这里插入图片描述

我在实际使用中，也确实没有发现什么问题，只是看到有警告觉得会不会隐藏问题，所以查了一下。

但是，如果你的 INT64 格式的权重确实超过了 INT32 能表示的范围，那么，在转换时（cast down to INT32）就会抛出错误，参考：
链接: link

 [W] [TRT] onnx2trt_utils.cpp:246: One or more weights outside the range of INT32 was clamped

在这里插入图片描述

解决方法

网上有一些解决办法，如用 onnxsim 简化模型，但是，我尝试了一下，简化了仍然会有这个警告。 如果你遇到了，可以尝试一下：

python -m onnxsim .\best.onnx .\best-sim.onnx

或者在 python 脚本中导出时，在 export 方法中添加这个简化参数：

model.export(format = "onnx", simplify = True, 其他参数)

xxLearn

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

onnx 模型 转换成 TensorRT 模型 时, INT64 cast down to INT32 问题

问题

原因

有无影响

解决方法

onnx 模型转换成 TensorRT 模型时, INT64 cast down to INT32 问题