本文学习笔记整理自https://www.bilibili.com/video/BV1yi4y1g7ro?p=4
参考博客:https://blog.csdn.net/qq_37541097/article/details/81214953
YOLO V1、YOLO V2、YOLO V3论文链接
提取码:a70x
1、YOLO v1
YOLO V1的思想
将原始图片划分成s×s的网格(grid_cell),如果object的中心落在这个网格内,则这个网格就负责预测这个object。
每一个网格预测b个bounding_box,每个bounding box
预测位置信息,还要预测confidence。confidence的表达式为:
每个grid cell预测c个类别分数。
对于生成的7×7×30的特征层 ,30=20+2(4+1)
20代表数据集中包含20个类,grid