本人是学生一枚,理解可能颇有偏颇~
写在前面:个人理解的一些比较关键的点
过程:
正常卷积,对某层产生P(通道数)个的激活图求梯度得到P个特征梯度图,在此图上找响应最强烈的位置, 作为原图中的关键点。关键点的个数等于P,从P个关键点中选出M个(可以随机选择,也可以用paper中的星座算法检出率更高一些),以选出的关键点为中心产生根据公式产生M个边框(相当于窗)。之后对这些边框中的图像进行CNN分类(即利用边框提取特征),具有最高分类信息的部分被用作估计边界框(即最关键的部分,以此作为分类依据)。
注意:
Paper用微调来进行数据增强(在选出M个之后进行的微调),具体不懂?
Paper中说与语义提取边框相比,其更有普适性。
注意激活图与概率图的对应(未来)。
星座(Constellations)算法
利用卷积网络特征产生一些关键点, 并基于这些关键点来提取局部区域信息. 通过对卷积特征进行可视化分析, Simon等人发现响应比较强烈的区域往往对应于原图中一些潜在的局部区域点. 从这一角度来看, 卷积特征还可以被视为一种检测分数, 响应值高的区域代表着原图中检测到的局部区域. 但是, 特征输出的分辨率与原图相差悬殊, 很难对原图中的区域进行精确定位. 受前期研究工 作[59, 60]的启发, Simon 等人采用的方法是通过计算梯度图来产生区域位置。
卷积特征的输出是一个W × H ×P维 的张量, P表