最近在对TensorRT接口库进行封装(基于VGG16 - refinedet SSD和yolo V2),但是出现一个很奇怪的问题,就是在执行VGG16-refindet SSD时,大批量跑图时,图片跑一部分后(图片数量是定植,通常跑到1460张图片后就出不来结果了),后面的图片出不来结果,同时相应的运行时间从正常的50ms降到了10几ms至30ms不等。
无法找到问题原因,初步猜测有两个原因:
1.GPU和CPU数据没有同步;
2.由于SSD最后一层要提出来进行计算(方便传NMS阈值和置信度阈值),但是实现又是gpu编程,所以可能在这个过程中出现错误;
当前还在调查中;