Deepstream 并行模型推理 - Python

D4MONZZZ

已于 2023-03-30 17:08:09 修改

阅读量1k

点赞数 1

分类专栏： Deepstream笔记文章标签： python 人工智能

于 2023-03-29 17:24:06 首次发布

本文链接：https://blog.csdn.net/weixin_42202176/article/details/129840472

版权

Deepstream笔记专栏收录该内容

4 篇文章

订阅专栏

文章探讨了在Deepstream中使用Python进行并行模型推理时遇到的问题，包括C代码闭源导致的实现困难，特别是nvgstmetamux插件在Python中的使用。作者发现官方的streammux-tee-streamdemux-streammux结构在Python中可能导致数据流问题，而通过简化结构，使用streamdemux和tee的组合解决了这一问题。文章强调了demux配置的重要性，并指出官方文档的不足。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Deepstream 并行模型推理 - Python

之前的应用都是一个管道一个app，就算有多个模型推理的应用需求也是采用的串行方式。然而一个pipeline一个应用还是太过于死板。正好看到英伟达官方退出了单pipeline并行模型推理的例子（~~不是因为公司任务~~）。网上python相关的代码基本没有（谷歌也搜不到），就提前踩了一下坑。

References

问题

官方示例是C写的，用python实现会有很多未知的问题。
C代码中很多函数是闭源的，无法深入去看实现细节。
官方的nvgstmetamux插件直接丢了一个so动态链接库给你，C还好，makefile里面写一写就行了，python要用pybind注册转一堆操作，反正就算把这个包丢到lib路径下，用python是不能make这个gstreamer插件的。

实现过程

先看官方

在这里插入图片描述
图片来源
官方的做饭是首先在主pipeline中使用了一个streammux，之后接了一个tee。重点来了，官方是分了N个branch，每个branch都有一组streamdemux和streammux来分离/拼接需要的视频源，具体实现代码可以参考官方代码中的create_parallel_infer_bin函数。
然而在用python复现这个操作的时候，却出现了意料之外的问题：除了第一个branch，其他剩余的branch都没有数据。
具体来说，在其他branch的sink（统一为fakesink）如果设置async为false，那么整个pipeline就会卡在第一帧，因为其他branch在无休止的等待数据到来。async设置为true，则只有第一个branch有数据。在其他branch的任意位置放置探针来打印FPS，则全为0。
随着进一步实验，在移除掉其他路的streammux和streamdemux，tee出来直接接PGIE-n之后，则恢复正常。所以应该是哪儿设置不对，然后试了很久也不清楚（这俩插件的代码都是闭源的）。

另一种方法

因为业务需求，必须要根据不同的源来进行模型的选择，还需要同一个源多个模型推理。所以想了想，也不一定需要按照官方的做法来。其实tee和demuxer的作用是差不多的，那么我们主管道中使用一个streamdemux和streammux配对，对于主管道的demuxer分出来的N个视频源，每个视频源接一个tee，对于任意branch的子streammux，只需要修改原来的streamdemux-streammux配对为tee-streammux即可。
事实证明这种方法是可行的。所以最后的罪魁祸首应该就是demux没配置对，然而官方关于demux的文档实在是太少了，根本无从下手，只能暂时用这个方法代替了。
最后的管道长这样
在这里插入图片描述