鉴于YOLOv1的缺点:
①定位差(因为grid cell生成的bounding box数量太少)
②检测小目标和密集目标能力差(因为只能检测出grid cell数量的类别)
因此引入了yolov2 《YOLO9000: Better, Faster, Stronger》
YOLOv2
①全连接层后使用BN层
②High resolution classifier
③anchor
相比于yolov1每个grid cell随机生成两个bounding box,YOLOv2根据给定尺寸生成候选框(称为anchor、先验框),仍然选取其中与真实框IOU大的作为拟合对象(相比v1的随机生成,v2的两个候选框更有针对性,训练效果更好速度更快)并且v1最终使得候选框生成的时候就与真实框重合而v2中anchor位置是不会发生变化的仅训练真实框与anchor的偏移,使得最终根据偏移生成的预测框能和真实框重合
同YOLOv1一样,通过网络模型得到13*13*125 tensor,其中125=5*25表示每个grid cell生成5个anchor ,每个anchor用25个参数表示了它的位置和类别 因此不用再针对候选框做判断类别和形状
总结:V1的时候是bounding box来拟合ground truth,v2是anchor产生的预测框来拟合ground truth
【目标检测】YOLO系列Anchor标签分配、边框回归(坐标预测)方式、LOSS计算方式_yolox smoothl1_zhicai_liu的博客-CSDN博客