Reference
what is STN ?
- module inserted to CNN without any extra training feature maps
- learn invariance to translation, scale, rotation, and more generic warping
Application
- image classification
- co-localisation
- spatial attention
Pipeline
- Forward
- 通过locatnet,提取输入图像的theta(将用于仿射变换);
- 根据输入图像的width和height以及仿射变换(或者TPS)的参数theta,可以生成目标位置在输入图像(U)中对应的位置(与输入图像位置一直的目标索引);
(由torch.bmm, Batch matrix matrix product of matrices生成)。 - 根据目标在输入图像中的对应位置(索引矩阵)利用双线性插值得到目标输出。
- backward
Examples