基本范式:sliding windows, conv based dense detection, bounding box, multi-sacle detection and FPN
单阶段&无锚框detector选讲:RPN, YOLO, SSD, focal loss与 retinanet 技术, fcos
bounding box:
框定目标物体的框,一般来说有两种描述方法:
1. 左上,右下角的坐标来构建
2. 中心坐标与框的长宽来构建
评价框质量的指标:IOU,交并比,在有多个框时,两个矩形框之间交集的面积与并集的面积之比,IOU越靠近1则说明框的重合度越高。
1. 启发式算法代替暴力遍历操作:先筛选出可能包含物体的位置
2. 卷积网络进行密集预测,相比暴力锚框进行遍历来说已经减少了不少冗余计算
忽略padding操作可能带来的区别,卷积操作带来的平移不变性,导致了先做全图卷积,再于提取的特征图中剪裁所需要部分的特征,再小特征图中进行裁剪,避免进行大量的卷积特征计算,因此才比直接暴力的划窗高明。