论文思想
将一幅图分成S*S个网格(grid cell),如果某个object的中心落在网格中心,则这个网格就负责预测这个object,每个网格要预测B个bounding box,每个bounding box的预测包括位置信息(x,y,w,h)和confidence值,每个网格还要预测C个类别的分数。
网络结构
在网络最后经过fc(1470)和reshape,最终得到了7730的tensor,这是因为在设计网络时,令S=7,B=2,C=20,即SS(B*(1+4)+C),得到了最终的预测结果。
损失函数
损失函数由bounding box损失,confidence损失,classes损失组成
知识点
缺点
- 群体小目标效果差
- 尺寸发生变化时效果差
- 定位不准确