本系列作者:木凌
时间:2016年12月。
文章连接:http://blog.csdn.net/u014540717
QQ交流群:554590241
一直不知道7×7的网格到底是干什么的,不就是结果预测7×7×2个框吗,这跟把原图分成7×7有什么关系?不分成7×7就不能预测7×7×2个框吗?
之前跟一个朋友讨论,他说7×7的网格是作为回归框的初始位置,我后来的很长一段时间一直这么认为,后来想想不对啊,bbox的初始位置不是根据各层的权重得到的吗?各层权重是随机初始化的,7×7的grid怎么能作为bbox的初始位置?我脑子被驴踢了么,竟然一直这么认为。
看了源码之后又看了faster-rcnn的论文中关于rpn的介绍,又看了rpn的代码,然后豁然开朗,我们来分析一下
一、YOLO
首先你应该看完YOLO源码详解(三)- 前向传播(forward),之后问题就简单了,只有一句话:grid和anchor的唯一作用就是为了计算IOU,从而来确定正负样本。在YOLO中,计算完IOU后确定loss function中的 1o