semantic segmentation
语义分割面临着语义和位置之间的内在紧张关系:全局信息解决了what, 而局部信息解决了where。
FCN
- train FCNs end-to-end for pixelwise prediction
- (与classification相比,将output通过transposed convolutions 的upsampling来得到pixelwise output)
- 深度特征层次结构encode了非线性局部到全局金字塔中的位置和语义。
- 定义了一个跳过架构,以利用这个来结合deep、coarse、semantic 信息和shadow、fine、appearance信息
U-net (convolutional networks for biomedical image segmentation)
- 扩展FCN,使得它可以在很少的training images上运行
- 具体是,通过skip connection将通过contracting path得到的 high resolution features与up-sample output结合,从而提供local信息,decoding part前传context information
- 基于边界的加权loss
- 数据增强通过deformation
- 只能用于slice segmentations tasks
V-net (Fully convolutional neural networks for volumetric medical image segmentation)
- 与u-net的的结构相似,但v-net是处理MRI volumes的。具体是用3D convolution实现
- 引入了基于Dice coefficient的新loss