语义分割
从原理上来说,语义分割就是像素级别的分类,传统的方法也是直接按照这个思路来做的,效率比较低,而从FCN开始,语义分割有了相对比较专用的方法。
0. 重要的数据集:PASCAL VOC和COCO
1. FCN
用于图像(N×M)分类的网络前端用卷积层提取特征,后端用全连接层进行分类。假设总共有K个类别,则全连接层最后会输出一个1×K的向量。FCN(Fully Convolutional Network,全卷积网络)将用于分类的全连接层替换为(反)卷积层,输出变为N×M×K的向量。
FCN还有一个技巧,如下图所示,用反卷积网络进行上采样的时候把上采样的结果与前面pooling的结果相加,有助于提升结果。
2. U-Net
U-Net是FCN的改进版。针对医学图像提出了U-Net,因此U-Net不用在ImageNet上预训