极简笔记 多篇weakly supervised segmentation笔记
Backtracking ScSPM Image Classifier for Weakly Supervised Top-down Saliency
文章主要思想是通过遮挡部分区域,观察分类confidence的改变来决定pixel-level的预测。文章没有使用CNN结构,而是使用SIFT特征+稀疏编码+SVM进行图像分类,由于稀疏编码需要向量字典,因此分类特征的每一维能对应到原图的patch,通过判断该位特征是否对分类起positive作用来判断原patch属于object的概率。得到大量候选patch之后,通过掩码的方式把分类特征中与该patch维度无关的元素设为0,在进行分类,如果预测confidence大于0.5则认为该patch落在saliency范围。
思考:个人认为文章存在的问题是分类最显著区域不包含object全部范围,常常只是动物头部位置,当头部被遮挡,其他区域都有较大可能无法分类,因此该方法无法进行整体区域的细微分割。以及稀疏编码做分类这个强监督baseline有点低。