Spatial Transformer Network (STN)原文解读

最近在研究attention机制,这篇是发表于16年的一篇涉及Attention机制的paper。

提出的原因:

(1)现有的CNN结构对空间不变形的处理能力较弱

(2)希望根据文理和形状就可以区分object的方位和部分变形

(3)max-pooling具有一定的空间不变形能力,但是局部的,而且只限制在高层次的cnn和max-pooling层,中间层无法获取空间转换能力。(某种程度来说,现有的CNN的空间转换不变性是受限的、预定义的)

 

优点:

(1)end-to-end的train

(2)stn的trainformer模块是可微的,不需要使用有监督训练或者修改现有优化机制,根据自己的特征图就可以主动学习特征图的转换能力

(3)spatial transformer能解决的图片转换种类:平移(translation)、缩放(scale)、旋转(rotate)和扭曲(warp)

(4)STN直接对数据处理,而不是对特征提取器处理!

 

原理:

spatial transformer的模块组成:定位网络、产生网格、抽样映射。

(1)localisation network

转换的theta多种多样,实现形式也是多种多样,只需要最后一层可以输出回归值就行。

(2)grid generator

\left(\begin{array}{c}{x_{i}^{s}} \\ {y_{i}^{s}}\end{array}\right)=\mathcal{T}_{\theta}\left(G_{i}\right)=\mathrm{A}_{\theta}\left(\begin{array}{c}{x_{i}^{t}} \\ {y_{i}^{t}} \\ {1}\end{array}\right)=\left[\begin{array}{ccc}{\theta_{11}} & {\theta_{12}} & {\theta_{13}} \\ {\theta_{21}} & {\theta_{22}} & {\theta_{23}}\end{array}\right]\left(\begin{array}{c}{x_{i}^{t}} \\ {y_{i}^{t}} \\ {1}\end{array}\right)

映射方向是:输出target=》输入source

 

(3)sampler

对输入特征图的像素抽样,计算经过何种方式可以获取到输出像素值。

需要保证输入和输出的channel数目一致。

 

源码实现注意点:

(1)spatial transformer的数目(一般来说6个参数作为整体)和输入图片数目保持一致。

 

 

更多学习笔记可以关注我的微信公众号「kelly学挖掘」,欢迎交流。

-- 未完待续 --

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
空间变换网络(Spatial Transformer Networks,STN)是一种神经网络结构,用于改善卷积神经网络(CNN)的空间不变性。STN可以对经过平移、旋转、缩放和裁剪等操作的图像进行变换,使得网络在变换后的图像上得到与原始图像相同的检测结果,从而提高分类的准确性。STN由三个主要部分组成:局部化网络(Localisation Network)、参数化采样网格(Parameterised Sampling Grid)和可微分图像采样(Differentiable Image Sampling)。 局部化网络是STN的关键组件,它负责从输入图像中学习如何进行变换。局部化网络通常由卷积和全连接层组成,用于估计变换参数。参数化采样网格是一个由坐标映射函数生成的二维网格,它用于定义变换后每个像素在原始图像中的位置。可微分图像采样则是通过应用参数化采样网格来执行图像的变换,并在变换后的图像上进行采样。 使用STN的主要优点是它能够在不改变网络结构的情况下增加空间不变性。这使得网络能够处理更广泛的变换,包括平移、旋转、缩放和裁剪等。通过引入STN层,CNN可以学习到更鲁棒的特征表示,从而提高分类准确性。 关于STN的代码实现,您可以在GitHub上找到一个示例实现。这个实现使用TensorFlow框架,提供了STN网络的完整代码和示例。您可以通过查看该代码来了解如何在您的项目中使用STN。 综上所述,spatial transformer networks(空间变换网络)是一种神经网络结构,用于增加CNN的空间不变性。它包括局部化网络、参数化采样网格和可微分图像采样三个部分。通过引入STN层,CNN可以学习到更鲁棒的特征表示,从而提高分类准确性。在GitHub上有一个使用TensorFlow实现的STN示例代码供参考。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值