[论文理解]Spatial Transformer Networks(STN)

本文探讨了Spatial Transformer Networks(STN)如何引入transformation invariance到CNN中,通过Localisation net预测参数θ,结合Grid generator进行图像变换。STN可应用于CNN的任意深度,实现旋转、缩放等操作,其采样过程由Sampler完成。
摘要由CSDN通过智能技术生成

0 写在前面

在对原文进行了翻译,以及参考了别人的一些博客后,lz打算提炼一下自己对STN的理解,后续有更深入的认识后会不断地增加内容。运用pytorch实现的STN代码可以点这里查看

1 STN的创新点

单纯的CNN对于图像的transformation(旋转、缩放、大尺度平移)是不具有invariance的。而这篇论文创新性地提出了一种spatial transformer(ST)结构,一定程度上赋予了CNN transformation invariance,算是STN领域的开山之作了,谷歌引用3400+。

2 ST的工作原理

在这里插入图片描述

图1 ST的结构

含有ST的CNN叫做STN。ST可以被插入到CNN的任何深度,比如图像输入端,或者是中间的特征层。数量也是没有限制的。

1.U是一个输入图,可以是初始输入图像,也可以是CNN中间特征层。

2.Localisation net(本地网络)是一个神经网络,比如是CNN或全连接层。无论是什么形式,Localisation net最后都会有个回归层,否则无法输出参数 θ \theta θ。工作时,前一步的U被丢到Localisation net中,回归得到参数 θ \theta θ

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值