![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
模型部署
文章平均质量分 83
昌山小屋
917
展开
-
【OpenPCDet】稀疏卷积SPConv-v1.2代码解读(3)
在src/spconv/all.cc文件中通过Pytorch提供的OP Register(算子注册的方式)对底层c++ api进行了注册,所以这里实际调用的是src/spconv/spconv_ops.cc文件种的getIndicePairs函数。indiceNum用于保存卷积核每一个位置上的总的计算的次数,因为是稀疏卷积所以卷积核上每一个元素和有效数据的运算次数可能是不同的。本质上来说就是一个表。再将输入、输出的哈希表中的序号建立起联系,这样就可以基本实现稀疏卷积,因此这也是稀疏卷积实现的关键。原创 2022-11-03 23:40:16 · 1399 阅读 · 0 评论 -
【模型加速】自定义TensorRT NMS3D插件(2)
添加自定义TensorRT插件 TensorRT的NMS Plugin在官网已有开源,但不符合我本次实验的需求,所以还得再自定义TensorRT Plugin。随着tensorRT的不断发展(v5->v6->v7),TensorRT的插件的使用方式也在不断更新。插件接口也在不断地变化,由v5版本的IPluginV2Ext,到v6版本的IPluginV2IOExt和IPluginV2DynamicExt。添加自定义TensorRT Plugin的方式有多种,以Tens...原创 2022-04-10 17:20:56 · 1578 阅读 · 0 评论 -
【模型加速】自定义TensorRT NMS3D插件(1)
需求是这样的,在做PointPillars模型的加速的时候我注意到网络的检测头部分小型操作很多,加速效果不明显。此外,3D检测模型的NMS部分通常是作为后处理的一部分来单独实现,TensorRT并没有直接支持3D NMS的导出。本着学习的目的,我将PointPillars模型中的检测头(单头)和3D NMS两部分合并到一个TensorRT Plugin,实现端到端的推理。其最终效果如下右图所示,自定义的NMS3D Plugin包含了整个后处理部分。如何在onnx的输出后面增加NM...原创 2022-04-09 15:50:44 · 1318 阅读 · 0 评论