神经网络与深度学习课程总结三-CSDN博客

P(精确率）： 𝑇𝑃/(𝑇𝑃 + 𝐹𝑃)，标识“挑剔”的程度
R(召回率）： 𝑇𝑃/(𝑇𝑃 + 𝐹𝑁)。召回率越高，准确度越低
标识“通过”的程度
精度(Accuracy)： (𝑇𝑃 + 𝑇𝑁)/(𝑇𝑃 + 𝐹𝑃 + 𝑇𝑁 + 𝐹𝑁)
P-R曲线，表示了召回率和准确率之间的关系。精度(准确率)越高,召回率越低
假设一个测试集，其中图片只由大雁和飞机两种图片组成，
True positives : 飞机的图片被正确的识别成了飞机。

False positives: 大雁的图片被错误地识别成了飞机。

False negatives: 飞机的图片没有被识别出来，系统错误地认为它们是大雁。

True negatives: 大雁的图片没有被识别出来，系统正确地认为它们是大雁。

（2）置信度与准确率

调整阈值可改变准确率或召回值。可以通过改变阈值（也可以看作上下移动蓝色的虚线），来选择让系统识别能出多少个图片，当然阈值的变化会导致Precision与 Recall值发生变化。比如，把蓝色虚线放到第一张图片下面，也就是说让系统只识别出最上面的那张飞机图片，那么Precision的值就是100%，而Recall的值则是20%。如果把蓝色虚线放到第二张图片下面，也就是说让系统只识别出最上面的前两张图片，那么 Precision的值还是100%，而Recall的值则增长到是40%。

（3）AP

mAP：均值平均准确率，每一个类别均可确定对应的AP 多类的检测中，取每个类AP的平均值，即为mAP。

适用方面：实际图像分类任务（多类）

1.2 目标检测与YOLO

1.2.1 目标检测问题

目标检测是在给定的图片中精确找到物体所在位置，并标注出物体的类别。

物体的尺寸变化范围很大，摆放物体的角度，姿态不定，而且可以出现在图

片的任何地方，并且物体还可以是多个类别。

目标检测问题发展

R-CNN
SPP NET
Fast R-CNN
Faster R-CNN
最终实现YOLO

YOLO是一个集大成的方法，不了解之前的方法，很难掌握YOLO的思路。

YOLO家族发展

1.2.2 一步法(two-stage)

无需候选框，直接出最终结果。突出优点：快！

分类问题扩展为回归 + 分类问题

问题 1 ：有一个框里有多个，有个多个框里有一个，怎么办？

多个框里有一个目标，取目标中心点所在框

一个框里有多个，暂不能解决

问题 2 ：多类目标怎么办？

使用独热编码扩展类别数

1.2.3 YOLO网络结构

YOLO官方的模型结构：

网络结构包含24个卷积层和2个全连接层；其中前20个卷积层用来做预训练，后面4个是随机初始化的卷积层，和2个全连接层。

YOLO 网络输入： YOLO v1在PASCAL VOC数据集上进行的训练，因此输入图片为448 × 448 × 3。实际中如为其它尺寸，需要resize或切割成要求尺寸

YOLO 模型处理： 𝟕 × 𝟕 网格划分。

将图片分割为 𝑆 2 个grid( 𝑆 = 7 )，每个grid cell的大小都是相等的

➢ 每个格子都可以检测是否包含目标

➢ YOLO v1中，每个格子只能检测一种物体（但可以不同大小）。

YOLO网络输出：

输出是一个 7 × 7 × 30 的张量。对应 7 × 7个cell 。每个cell对应2个包围框(bounding box, bb)，预测不同大小和宽高比，对应检测不同目标。每个bb有5个分量，分别是物体的中心位置(𝑥, 𝑦)和它的高 (ℎ) 和宽 (𝑤) ，以及这次预测的置信度。在右图中，每个框代表1个预测的bb，粗细代表不同的置信度，越粗得越高。