智能计算系统笔记——第三章深度学习
参考:《智能计算系统》陈云霁,李玲,李威,郭崎,杜子东[著]
3.3基于卷积神经网络的图像目标检测算法
经典的目标检测算法模型有R-CNN系列、YOLO系列、SSD等。
目前,目标检测算法主要分为两大类:
(1)两阶段算法基于候选区域方法,先产生边框把物体框出,后用CNN对每个候选区域进行分类,其代表是R-CNN系列算法。
(2)一阶段算法对输入图像直接处理,同时输出物体定位及其类别,即框出物体的同时对物体进行分类,其代表是YOLO系列及SSD算法。
3.3.1评价指标
一般多物体检测时,通常用mAP(mean Average Precision)来衡量。
平均精度AP的计算过程:
假设100张图像为测试集,共5种类别,其中有25个事先人为标记为类别A的框。假设算法在100张测试图像中共检测出20个分类为A的候选框,各候选框的置信度用交并比(IoU)来度量。标签为0表示框内无物体,标签为1表示框内有物体。
(1)首先,根据置信度对检测出的候选框降序排列;
(2)按照置信度降序,依次计算只有N个正例时的recall和precision;
(3)对于每个recall对应的最大precision作为recall的对应precision;
(4)计算recall-precision曲线面积作为平均精度AP。
(5)最后,测试集中C种类别的检测的平均精度均值mAP为每个种类AP的平均。
3.3.2 R-CNN(Regions with CNN features)系列
(1)R-CNN
(2)Fast R-CNN
(3)Faster R-CNN
3.3.3 YOLO(You Only Look Once)