MIxformerV2的onnx和tensorrt加速

塔楼

已于 2023-12-28 14:38:22 修改

阅读量438

点赞数 1

分类专栏：算法计算机视觉/目标跟踪/目标检测文章标签：模型工程化目标跟踪深度学习 MixformerV2 Mixformer

于 2023-10-26 17:26:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28915885/article/details/134061038

版权

计算机视觉/目标跟踪/目标检测同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

MixformerV2的onnx和tensorrt加速

- 注意事项

地址：github地址

注意事项

转换成onnx模型之前，最好现简化算法的源代码，使其结构干净。因为在进行onnx转换后，可能在进行onnx→trt时算子不匹配，这时就需要去查看模型的源码，找出对应无法转换的算子，如果代码不精简，在对照算子这一步很费时间。需要对照的表可以参照onnx-tensorrt： https://github.com/onnx/onnx-tensorrt/blob/main/docs/operators.md。但是需要注意onnx-tensorrt的版本和当前使用的版本一致；
unbind的替换无法使用类似slice的操作，如q,k,v=qkv[0],qkv[1],qkv[2]，这会导致导出出错。使用split进行替换，split用于切片划分是支持转换的。split的使用方法可以参见pytorch官网；
permute可以使用transpose进行替换；
在进行推理数据输入engine模型之前，一定要保证数据的形状对应的内存数据是连续的。因为reshape或者permute之后的数据形状可能改变了，但是内存的布局并不会变化。需使用tensor.contiguous()使得数据在内存的布局连续。如果是numpy的数据，则需要使用np.ascontiguousarray(im_arr)使得输入的数据连续，否则会出现推理出的结果错乱。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

塔楼 CSDN认证博客专家 CSDN认证企业博客

码龄9年

46: 原创

8万+: 周排名

150万+: 总排名

5万+: 访问

: 等级

884: 积分

16: 粉丝

44: 获赞

4: 评论

85: 收藏

私信

关注

热门文章

分类专栏

计算机视觉/目标跟踪/目标检测 12篇
cuda编程 1篇
优化算法 1篇
C/C++ 19篇
java 1篇
python 3篇
机器学习 12篇
linux
算法 9篇
其他 4篇
caffe 5篇
Blob 1篇

最新评论

MIxformerV2的onnx和tensorrt加速
塔楼: 可以对pth模型进行拆解，重新写一个整体的模型的类来进行转化。参考Stark去实现https://github.com/researchmm/Stark/blob/main/lib/tutorials/STARK_Lightning_Ch.md
MIxformerV2的onnx和tensorrt加速
leadir1234: 博主你好，可以发下pytorch转onnx的代码吗
大端到小端的转换
nnnC123456780: 真不错。解释说明非常清晰，而且代码很简短！
对率回归的实验
yhhhw: 博主后面加一列1是为了什么啊

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。