《Faster RER-CNN: application to the detection of vehicles in aerial images》
解决什么问题
目标检测(Object Detection)是一个宽泛、通用的任务,旨在检测"万物"。但实际应用上,我们只需要检测部分物体即可。如常见的车牌检测、人脸检测和场景文字检测等。
如果直接将经典的目标检测算法(如Faster R-CNN、YOLO和SSD等)应用在指定任务上,比如利用pre-trained的网络对指定数据集进行fine-tune,一般也可以获得较好的mAP。但这里只是凑合解决,并不够完美契合。
本文要解决的问题就是在航空遥感图像(aerial image)上检测"小"且"旋转"的车辆。
- "小"是相对的,是指该物体在整幅图像中的相对大小。其实类似于小目标检测问题。
- "旋转"是指物体具体方向角度,不是四边绝对垂直的边界框,而是带有旋转角度的边界框(但相对垂直)。
看不懂我的描述?没关系,看下面的图示就知道了。常规的BBS(bounding boxes)已经不能满足于这项任务了,必须设计一种算法检测出带角度的BBS,其实后者计算的区域和原物体更加吻合,冗余信息更少(嘻嘻,冗余信息最少的还是segmentation)。