第十一章 Detection and Segmentation
总的内容包括Segmentation, Localization, Detection
第一小节内容为图像分割,了解图像分割本质是对每个像素点进行分类的过程,为了解决全卷积网络的计算复杂度问题,提出了与降采样相对应的上采样的方法。使用降采样和上采样方法对应,得到完整的End-to-End网络。
一、分割
分割模型其实也会分为两种,一种是只进行分割,将不同类别以像素级分别表示,另一种全分割就是在分割的基础上对每个物体进行分类,其中还要比较复杂的是将某一同类别物体但是不同个体进行分割
Semantic Segmentation主要任务是将每个像素(pixel)做分类
由于只根据像素进行分类,所以并不对实例进行区分,例如上图中的两个牛都分为牛,这也是语义分割的一个不足之处
思路:
idea1:滑动窗口,将每一个窗口分别计算类别,然后输出
缺点:计算量大,而且效率低,有很多overlap
idea2:Fully Convolutional:要做下采样和上采样
上采样:
upsampling:去池化(unpooling)
Transpose Convolution
实际应用过程中最大化下采样和最大