《2015_Noh_Cite=4488_Learning deconvolution network for semantic segmentation》
铺垫和引入
encoder使用VGG-16的卷积层进行学习,decoder使用反卷积deconv和反池化unpool进行上采样。
将object proposal候选域推荐(edge box画方框)送入训练后的网络,整幅图像是这些proposal分割结果的组合,这样就可以解决物体太大或者太小所带来的分割问题,改进了现存基于FCN的方法
但是这样做需要人为干预,网络从全自动变成半自动的,我们其实不推荐这样改。
FCN的critical limitations
- 感受野大小固定predefined fixed-size receptive field。——The object that is substantially larger or smaller than the receptive field may be fragmented支离破碎的-割开 or mislabeled
- (1)有的太大的物体,我的感受野如果没那么大的话,会导致分割错误,因为我们没有把整个大物体都看全,我就会认为整个大物体是由两个小物体组成的(意思就是你把 一个东西给割成了两个物体),从而造成错分。大的object只会用到局部信息Label prediction is done with only local information for large objects and相同标签的object可能会被赋上不同的标签 the pixels that belong to the same object may have inconsistent不同的-不一致的 label。你可以看原文提供的下图,你的感受野比较小,object很大,图中好几个小物体识别不出来,train bycycle persion各自的像素点都被label成了bus
- (2)尺度太小的物体,由于我的感受 野是 比较大的,看到的物体的背景信息和其他信息比较多,进而影响我对这个小物体的判断,我很容易把这些小物体当做background。Small objects are often ignored and classified as background.图中这些人太小了,FCN误把他们当做background上的几个纹理了,没识别出来。