groupDETR要解决的问题是:既能够一对多的匹配,又能够不用NMS,节约计算开销;
在original DETR中是一对一的匈牙利匹配:
1.如果增加query的数量,是可以提升检测性能的,但是计算开销也会增大,原因在于query个数越多,越容易命中目标;
比如从300个query提升到3300个query,其性能可以提升2个点;
2.如果改成一对多的匹配,比如把一个gt匹配上2个positive box,可以加速收敛,提升一点性能;
但是会导致使用的时候需要用到NMS;
所以groupDETR提出的方法是在训练的时候用多组query,每组内仍然保持一对一匹配,推理的时候只用任意一组query就可以不用NMS了;
groupDETR的具体网络结构如下: