如果你是做微小物体目标检测的,那么这篇文章就对症下药了!
这两天一直在做mmdetection数据增强,然后想用browse_dataset.py可视化一下数据集的效果。但发现部分的标签不见了,比如下面这张图,红色所指的地方没有标出来。
这个问题其实藏得很深。我换成了大一点的样本的数据集,发现就不会有这个问题。所以我估计有可能是样本尺寸太小导致的。要解决这个问题,首先要理解annfiles是怎样被读进去同时转成bbox的。
首先他会调用一个叫做dota.py的代码,因为我是dota的数据集类型,所以就调这个。在这个代码中最有关联的是load_annotations的这个函数,其中有一段比较关键:
我一行一行print,发现问题就出现在红色框这里。readlines的时候是没事的,但是转成obb就有问题了。然后我就去看这个函数发生了什么。
这个函数的实现,在这里:
因为默认就是oc,所以我就直接看oc版本的poly2obb_np发生了什么。
这样马上就看出问题了!如果长宽小于2直接就pass掉了!而我是做微小物体检测的,所以很容易漏掉这些很小的样本!为了保守起见,我把le135和le90同样的地方也都注释掉了,不让他直接return。这时候就解决问题啦!标签就没有丢三落四啦!