YOLOV2
批归一化
防止过拟合, 去除dropout
高分辨率
将224X224 提高到448X448, 使网络能够更好的调整参数
加入Anchor Boxes的卷积操作
移除全连接层,使用Anchor Boxes ,将网络看成回归分类问题,更易于网络学习
维度聚类
用算法挑选出最好的候选框
直接定位预测
使用logistic激活函数来将网络单元格的位置落于0和1之间,来表示对应cell左上角位置的相对偏移值, 网络预测每个边界框的5个坐标, tx, ty, tw, th, to。 (cx, cy) 为格子相对于图像左上角的偏移量, 边界框的宽度和高度为pw, ph, 那么最后的预测值为
最后的卷积层加入passthrough架构
仅仅添加一个passthrough层, 从26X26分辨率1的更早层中提取特征
passthrough通过将相邻层特征堆叠到不同通道而不是空间位置来连接高分辨率特征和低分辨率特征, 类似于Resnet的恒等映射
多尺度训练
网络会每隔几个迭代就会改变网络, 每隔10次迭代就会随机选择一个新的图片尺寸大小, 然后继续训练, 这样会迫使模型学习如何在各种维度上完成较好的预测。这意味着相同的网络可以预测不同分辨率下的检测结果