V2 -- BN
- V2版本舍弃了Dropout,卷积后全部加入Batch Normalization
- 网络的每一层的输入都做了归一化处理,收敛相对更容易
- 经过Batch Normalization处理后的网络会提升2%的mAP
- 从现在的角度来看,Batch Normalization已经成为网络必备处理
V2 -- 更大的分辨率
- V2训练是用的是224*224,测试是使用的是448*448
- 可能导致模型水土不服,V2训练时额外有进行了10 次448*448的微调
- 使用高分辨率分类器后,YOLOv2的mAP值提升了约4%
V2 -- 网络结构
- 使用DarkNet,实际输入为416*416
- 没有FC层,(FC层参数多,训练慢)5次降采样,(13*13)
- 1 * 1卷积节省了很多参数
V2 -- 聚类提取先验框
- fster- rcnn系列选择的先验比例都是常规的,淡食不会当完全适合数据集
- K-means聚类中的距离:d(box, centroids) = 1 - IOU(box, centroids)
V2 -- Anchor Box
- 通过引入anchor boxes,使得预测的box数量更多
- 跟faster - rcnn系列不同的是先验框并不是直接按照长宽固定比给定