STN系列之Spatial Transformer Networks

最新推荐文章于 2024-08-16 08:26:58 发布

迷途中一个小书童

最新推荐文章于 2024-08-16 08:26:58 发布

阅读量3.9k

点赞数 1

文章标签：机器学习计算机视觉 ai stn 人脸识别

本文链接：https://blog.csdn.net/dreamer_on_air/article/details/77836507

版权

本文介绍了Spatial Transformer Networks（STN）的概念，它解决了计算机视觉中的形变问题。STN作为神经网络的一部分，实现了形变矫正的端到端学习。通过STN，网络可以学习到适当的变换参数，对输入特征图进行采样，从而进行空间变换。实验表明，STN在手写数字识别、街景房屋号码识别和细粒度分类任务中都能提高性能，尤其是在处理多个目标或关注不同区域特征时。STN为将传统图像处理方法融入深度学习提供了新的思路。

摘要由CSDN通过智能技术生成

本来是要看这篇paper的：Supervised Transformer Network for Efficient Face Detection. Dong Chen, Gang Hua, Fang Wen, and Jian SunMicrosoft Research

这是一篇2016年做人脸检测的工作，主要的idea是通过一个transform net来把人脸对齐的过程变成end-to-end，隐式的来做。其先导工作为
Spatial Transformer Networks. Max Jaderberg Karen Simonyan Andrew Zisserman Koray KavukcuogluGoogle DeepMind, London, UK。也是利用spatial transformer network来解决pose、distortion、rotation比较大的这类识别任务，比如ocr、finegrind等。

所以花了些时间先来看了Spatial Transformer Networks.这个工作，还是个相当漂亮的工作。大部分计算机视觉任务都有个绕不开的问题就是形变，拍摄的角度、物体本身的形变都会导致检测、识别变得更加困难。传统的方法一般是定义一些关键点，然后根据关键点和标准物体图像的对应关系来做形变的矫正。那么end2end大法被验证是更优的方案之后，已经有很多传统方法被加入网络结构中成为深度学习中的一层，比如conv/pooling/normalize/embedding之类的。所以作者提出了一个很好的idea，做形变矫正这件事情也可以作为网络的一个层来表示，也就是这样：

最低0.47元/天解锁文章

迷途中一个小书童

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫