本篇笔记部分基于飞桨课程:https://aistudio.baidu.com/aistudio/education/group/info/1297
一、整体总结
yolov3网络输出分候选框回归、objectness(是否有目标)检测、候选框内物体类别三部分。
其中候选框回归部分的损失采用的是平方误差损失的和,objectness检测采用的是logistic regression,类别检测采用的是logistic分类器,训练时用的binary cross-entropy loss。
主要就是快(不是两阶段的,而且用了Darknet,没用ResNet),同时效果也还ok。
yolov3的网络结构如图。
二、论文笔记
- 候选框回归与RCNN系列相似。如果想要了解原理可以看一文读懂Faster RCNN的2.4节bounding box regression原理。
b x = σ ( t x ) + c x b y = σ ( t y ) + c y b w = p w e t w b h = p h e t h b_x=\sigma(t_x)+c_x \\ b_y=\sigma(t_y)+c_y \\ b_w = p_w e^{t_w} \\ b_h = p_h e^{t_h} bx=σ(tx)+cxby=σ(ty)+c