与u-net一样,deeplab系列同样用于图像分割,但是两者是不同的。U-net通常用于医学领域,用于检测小目标,需要局部特征。而当目标较大时
空洞卷积(dilated convolution):也叫作扩张卷积或者膨胀卷积,简单来说就是在卷积核元素之间加入一些空格(零)来扩大卷积核的过程。空洞卷积可以增加感受野,当需要检测难度更大的样本时,就需要观测到更全局的信息。
左常规卷积,右空洞卷积
间隔起来的信息从哪来?在相邻两个值内填充0
通过设置dilated参数可以得到不同特征野的特征(3*3,7*7,15*15)
SPP:SPP结构又称空间金字塔池化,能将任意大小的特征图转化成固定大小的特征向量。
输入层:是有任意一张大小的图片,大小为w*h。
输出层:21个神经元-----即我们希望得到的21个特征。
分析:对输入的任意一整图片,分别进行4*4,*2,,,1*1分块,并分别取出每一个框内的max值,分别得到16,4,1个特征,一共有16+4+1=21个特征,将得到的21个特征拼接在一起。
ASPP(atrous convolution SPP):空洞空间卷积池化金字塔,其实和SPP差不多,只不过引入了不同倍率的空洞卷积