YOLO系列总结
1. yolov1
yolov1框架讲解
1.将image划分为77个网格,每个网格预测2个bbox的位置(X、y、W、h)、置信度( confidence为交并比)、 类别概率;
2.输出维度为77*(25+20 );
3.测试时,将条件类概率和预测框的置信度乘起来,表示每个box包含某类物体的置信度,这个分数可以将box中的类别可能性和预测精确度同时表示出来
4.基本网络模型为GoogLe Net ,但未使用它的inception模块,而是交替使用11和33卷积层
5.预训练分类网络,输入图像大小为224224
6.目标检测网络,输入图像大小为448*448
7.损失函数(平方和损失函数)包括4部分:框中心位置x,y损失+框宽高w,h损失+置信度confidence分类损失
YOLO V1优点
<1>速度快
<2>对图像有全局理解。用整个图像的特征去预测bbox
<3>候选框的数量少很多,仅772=98个
<4>每个网格只预测2个