MXNET部署TensorRT检查OP是否存在

最新推荐文章于 2023-11-29 06:45:00 发布

永恒_一瞬

最新推荐文章于 2023-11-29 06:45:00 发布

阅读量1.2k

点赞数 1

分类专栏：开源架构深度学习文章标签： convert tensorrt

本文链接：https://blog.csdn.net/yangjf91/article/details/90691206

版权

深度学习同时被 2 个专栏收录

20 篇文章 3 订阅

订阅专栏

开源架构

15 篇文章 2 订阅

订阅专栏

MXNET模型进行部署时可以使用TensorRT，其过程通常为将MXNET模型转换为ONNX，再通过TensorRT的ONNX解释器转换为TensorRT的序列化文件。但此过程中，MXNET的OP不一定可以转换为ONNX的结果，而ONNX的OP也只有部分可以在TensorRT中实现。

TensorRT支持操作

可参照TensorRT官方文档，这里面除了介绍支持的OP操作外，还有关于支持的平台和支持int8压缩的层等信息。
TensorRT支持操作

可以看到，由于ONNX开源，应该可以找到通过重新编译添加支持的操作，但未找到添加plugin的说明，从issues上看有人提这个问题，但目前没有得到回复。

ONNX支持操作

ONNX支持的操作可以在github的ONNX项目中查看，Operators.md中写明了支持的操作及其说明。
按照TensorRT 4 基本介绍及TensorFlow模型转化Uff格式导入（二）的说法，ONNX是不支持自定义层的。

MXNET支持操作

MXNET支持的操作可以在MXNET官网的NDArray API中查看，也写命令支持的操作及其说明。
MXNET实际可以转换为ONNX的操作可以在github 的python/mxnet/contrib/onnx/mx2onnx/_op_translations.py中查看，需要注意的是这里面出现的操作只能证明是通过master分支编译的版本可以支持，而自己电脑中安装的版本需要在python路径相应位置下查看。比如master分支的作为1.5.0未发布版，新增了对Deconvolution等操作的支持，而当前发布的到1.4.1不支持这些操作，如果只是临时转换模型，可以将master分支下的contrib/onnx整体替换自己python版本的文件。