由于模型的处理速度较低,尝试增加进程的方式来提高单GPU(24G显存P40)的处理(图片大小960X572)速度。
处理前,单GPU的处理速度大约为10fps。
通过多进程测试,得出三个进程同时进行,
视频中无目标或只有一个目标时,fps为17~18.
视频中有三四个目标时,fps为12~13.
通过以上测试,得出可以适当提高检测速度,但是提升效果不足以达到25fps的目标。
下面通过修改模型替换成yolo tiny 进行速度测试。
由于模型的处理速度较低,尝试增加进程的方式来提高单GPU(24G显存P40)的处理(图片大小960X572)速度。
处理前,单GPU的处理速度大约为10fps。
通过多进程测试,得出三个进程同时进行,
视频中无目标或只有一个目标时,fps为17~18.
视频中有三四个目标时,fps为12~13.
通过以上测试,得出可以适当提高检测速度,但是提升效果不足以达到25fps的目标。
下面通过修改模型替换成yolo tiny 进行速度测试。