一、语义分割(semantic segmentation)介绍
1.图像分类(image classification)
image.png
分类和定位(classification with localization)
image.png
物体检测(object detection)
image.png
语义分割(semantic segmentation)
image.png
实例分割(instance segmentation)
image.png
几个方向的对比:
对比图
二、 理解卷积,最大池化和转置卷积
1. 卷积(convolution)
一个卷积操作有两个输入
(I)3D输入图片(NinNinchannels)
(ii) k个过滤器组成的一个系列(filters/kernels/feature extractors),每个过滤器的尺寸为(ffchannels),f通常为3或5。
卷积操作的输出为一个三维的volume(也称为feature map或者输出),其尺寸为(NoutNoutk)
Nin和Nout的关系如下: