极简笔记 From Image-level to Pixel-level Labeling with Convolutional Networks
本篇文章是2015年的一篇依赖image-level标注的语义分割弱监督文章。文章主要流程是先让图片经过一个普通CNN,得到一个score map(相当于分割网络最后的预测结果,几个类别就几个channel),然后将每个类别的score进行集合,这里作者没有使用求均值或者求max的方式,而是使用Log-Sum-Exp (LSE)进行计算(公式如下):
s k = 1 r log [ 1 h o w o ∑ i , j exp ( r s i , j k ) ] s^k=\frac{1}{r}\log\left[\frac{1}{h^ow^o}\sum_{i,j}\exp(rs^k_{i,j})\right] sk=r1log[<