对yolo系列的统一学习
一、深度学习的经典检测方法
1.one-stage(单阶段)
yolo系列
通过单个CNN网络直接回归
特点:速度快,精确度低
2.two-stage(双阶段)
Faster-rcnn Mask-rcnn系列
在单个CNN网络的基础上再加上预选的步骤
特点:速度满,精确度高
二、yolo系列的各种指标
map:综合检测效果
置信度:检测出的图像是某物体的概率
IOU:检测框交集与并集的比值
Precision(精度):TP/TP+FP
Recall(召回率):TP/TP+FN
其中各部分的值含义如下
简单来说,检测提取出来的数据总和为TP+FP,其中,数据中判断正确的就是TP,判断错误的就是FP。而未检测提取的数据就是FN+TN,其中,其中本应被提取的数据为FN,剩下的就是TN。
所以,检测出来的数据中正确的数据越多,精读就越高;所有正确的数据中被检测出来的越多,召回率越高。
三、yolo的核心思想
YOLO:You Only Look Once
把检测问题转化成回归问题
在YOLOv1和v2版本中,把输入的图片分成n个格子,每个格子中心延申出两个候选框,对候选框中置信度大于阈值的做出筛选(基于IOU)并进行微调,小于阈值的忽略不计,最终输出图片。
四、整体网络架构
以上架构只限于YOLO初代版本,在后续YOLO版本中几乎已经不使用此架构(虽然后面的架构我还没学到)。