根据目前手头上的工作整理的一份清单,主要是自己的工作过程中,感觉到需要改进或者比较关注的问题,可能和一般的目标检测的研发不太一致,更多的还是些杂七杂八的点。
连续帧检测
一般的训练和评估都是针对单帧图像的,然而,实际应用中,很多都是针对连续帧(或者相近帧)的检测。
在连续帧检测上,即使在观感上,就会比较明显的感觉到不如单帧检测。
现象主要是以下:
- 目标不能连续检出,造成检测框的闪烁
- 偶尔的误识别
- 检测框的偶尔跳变和漂移
![c90db2a29a291c7bb34ee911b2fe41b5.png](https://i-blog.csdnimg.cn/blog_migrate/f0653c31746e6e4f254a31d8be3eaf38.jpeg)
以上就是连续两帧的图像,用COCO数据的模型。直接把没有处理的裸结果显示出来的话,观感上就非常明显了。
当然,这些都可以在工程上用一些方法来平滑掉。
但是,训练时,怎样让模型可以在连续帧上获得一个平滑的预测?包括检测框本身更加稳定的预测。
小目标、远距离检测
部分应用场景上,对识别距离是有一定的要求的,也就是对微小目标的识别。一般来说,这个需求比较小众,只有一些特殊的应用场景上需要。比如,高速上的目标识别。
在有些要求更高的场合,还需要与摄像头硬件结合,这样可以支持更远距离的目标识别。比如图森的一千米识别。