paper title:Spatial Transformer Networks
paper link: https://arxiv.org/pdf/1506.02025.pdf
oral or demo video:https://www.youtube.com/watch?v=T5k0GnBmZVI (symposium)
tutorial:https://www.youtube.com/watch?v=SoCywZ1hZak (Hung-yi Lee)
github: https://github.com/kevinzakka/spatial-transformer-network
conf & anthor:15NIPS, Max Jaderberg et al. (DeepMind)
arXiv submit v1:2015.06.05
主要内容:
文章主要介绍了Spatial Transformer(ST)模块,可以在网络中对输入进行变换,ST的变换作用于整张图像或特征图上,包括缩放、裁剪、旋转和非刚性变换。包含ST模块的网络不仅可以在图像中选择最相关(relevent/attenttion)的区域,还可以将这些区域变换到一个标准的pose,使得后面的网络层的识别变得简单。ST可以用标准的反向传播进行训练,在网络中插入ST层后仍可以进行端到端的训练。
网络结构:
1.Spatial Transformer Module
ST模块主要有三部分构成,如下图所示: