记录一些YOLO的知识点,有可能会在面试中遇到,做个笔记。
1. YOLOV1的损失函数
2.YOLOV2的损失函数
参考:https://blog.csdn.net/ChuiGeDaQiQiu/article/details/81229245
yolov2有13X13X5=845个bbox
YOLOV2的误差主要包含三项:1.该cell所产生的5个bbox与真实的bbox的iou的最大值小于设定值,则认为该cell不包含物体,即背景;2.真实的物体bbox的中心落在该cell上(红色)即为公式的第三部分;3.有些cell(黄色)既非背景又不是真实物体的中心,误差的计算是第二部分。
3.YOLOV3的损失函数
参考:https://zhuanlan.zhihu.com/p/76802514
4.v2和v3的多尺度的区别
1.v2的多尺度是训练时输入图片的尺度不同,每隔10个batch便随机从 {320,352,384.,,608}选择一个新的尺度作为输入图像的尺寸
2.v3的多尺度是分辨率的不同,在3个不同尺度的feature map上进行detection。在输入为416的情况下这三个特征图的尺度为1313,2626,52*52,这应该是对小目标影响最大的地方。
5 yolo的思想,v2,v3的改进
参考这篇博客
YOLO置信度:因此置信度可以定义为Pr(object)*IOU。很多人可能将Yolo的置信度看成边界框是否含有目标的概率,但是其实它是两个因子的乘积,预测框的准确度也反映在里面。