本文参考链接如下:https://www.zhihu.com/question/43609045
对于图像的语义分割,我觉得比较经典文章的基本上的框架是:conv + deconv + (后续的处理模块)。
在conv中,是这样操作的:举例说明
4x4的输入,卷积Kernel为3x3, 没有Padding / Stride, 则输出为2x2。输入矩阵可展开为16维向量,记作,输出矩阵可展开为4维向量,记作,卷积运算可表示为。在op.resharp后,将输入的矩阵变成16*1维度,相应的输入就变成4*1的维度矩阵。
这是正向传播。得到loss后,在反向传播的过程中,将所谓逆卷积其实就是正向时左乘,而反向时左乘,即的运算。