![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
onnx
文章平均质量分 91
xz1203
这个作者很懒,什么都没留下…
展开
-
人体姿态估计 c++版 HRNet tensorrt加速
上次用onnx模型实现了c++版的HRNet,加上NanoDet的目标检测,在我的笔记本(GTX960M)上实现了20FPS左右的帧率,参考HRNet C++实现。这次尝试使用了tensorrt对HRNet的onnx模型进行进一步加速,达到了25FPS左右的帧率。如下图所示。1.生成符合条件的onnx由于很多原因,onnx和tensorrt对一些算子的支持并不相同,有些算子在onnx上可以实现但在tensorrt上不能支持。因此需要对原来pytorch版HRNet的一些操作进行修改。HRNet的代码原创 2021-09-23 18:21:04 · 1942 阅读 · 9 评论 -
Lite-HRNet 轻量级的HRNet 转onnx
上个月cvpr2021出了轻量级的hrnet,依旧是MSRA的作品,这个系列都连着三年的cvpr了,太强了!假期结束才有想着去看看文章。简单看了看,发现flops降得好低啊,效果还不赖,于是尝试将模型转为onnx。关于文章内容的讲解,网上已经有不少了,例如Lite-HRNet讲解,主要的点是将ShuffleNet中的结构应用于HRNet中得到Naive Lite-HRNet,再用一个轻量级的单元conditional channel weighting替换可分离卷积中poinewise的1x1卷积,原创 2021-05-09 15:04:20 · 3705 阅读 · 14 评论 -
人体姿态估计 HRNet C++版
最近由于项目原因,需要用到HRNet网络,加上前面的目标检测部分,使用python版本的代码运行太慢,于是想到了用c++来重写HRNet,将pytorch的模型文件转换为onnx,采用onnx的c++的推理库。然后目标检测网络采用轻量级的nanodet,同时也采用onnx进行推理。最后,在我的笔记本电脑上(GTX960M)进行单人的姿态估计也跑到了20帧左右。其中nanodet是0.01s左右,hrnet是0.04s左右,hrnet是w32_256*192的模型转换而来的。多人的话时间就是成倍增长。原创 2021-04-25 22:39:35 · 3833 阅读 · 20 评论