1、Speed/accuracy trade-offs for modern convolutional object detectors
其主要考虑三种检测器(Faster RCNN,R-FCN,SSD)作为元结构,三种CNN网络(VGG,Inception,ResNet)作为特征提取器,变化其他参数如图像分辨率、proposals数量等,研究目标检测系统准确率与速度的权衡关系。
2、YOLO9000:Better, Faster, Stronger
其为YOLO升级版,其对YOLO方法作了一些改进,Better方面考虑(Batch Normalization, High Resolution, Anchor Boxes, Dimension Clusters, Direct location prediction, Fine-Grained Features, Multi-Scale Training),Faster方面提出一个新的Darknet-19结构。除此之外,其提出一个方法在目标检测数据集与图像分类数据集上联合训练,主要构建了一个视觉内容分层树结构WordTree。