YOLOV2/YOLO9000
- YOLO9000:Better,Faster,Stronger
- CVPR 2017,Best Paper Honorable Mention
- 引入了anchor box的思想(改进直接回归的粗糙做法)
- 输出层:卷积层替代YOLOV1的全连接层(通过卷积层减少网络结构对输入图像尺寸的敏感程度,因为FC层参数量同feature map的大小是息息相关的,卷积层无关)
- 联合使用coco和imagenet物体分类标注数据(用检测数据集学习物体准确的位置信息,分类数据集学习分类的信息)
- 识别种类、精度、速度和定位准确性都有大大提升
YOLOV2/YOLO9000改进之处:
- Batch Normalization
- 高分辨率分类器
- Anchor Boxes
- 细粒度特征
- Multi-Scale Training
这是主干网络的网络结构采用darknet,而yolov1作者采用了GoogleNet,整体速度比VGG更快,而在YOLOV2中采用新的主干网络模型,结构类似于VGG NET,采用三乘三的卷积核,池化后的整个channel的数量都会增加一倍,在网结构中采用Batch Normalization,归一化处理,让整个训练过程更加稳定,收敛的更快,得到一个模型规范化的效果。由于通过卷积代替之前的FC,因此输入的