Spatial Transformer Networks 论文笔记

Spatial Transformer Networks作为深度学习中的一个组件,用于对输入图像进行对齐。通过Localisation Network预测变换参数,grid generator生成变换网格,sampler使用双线性插值进行采样,实现可微的变换过程。实验表明,STN能提高数字识别的准确性,并在无标注数据情况下自动检测图像的特定部分。
摘要由CSDN通过智能技术生成

Spatial Transformer Networks 论文笔记


简介

  • Spatial Transformer Networks和BN一样相当于一个小插件,放在卷积网络中,其主要目的是对齐网络的每个输入。比如MNIST的手写数字识别,如果有一个图像中的数字有一定角度倾斜或偏移,Spatial Transformer可以对输入图像进行仿射变换,让CNN真正的输入变成对齐后的数字图像。
    image_1bs5pl1735bv9vojqtra14l7p.png-79.2kB
    image_1bs5plv68tc18c417ob1a2v1h8016.png-51.4kB

网络

  • 网络结构如Figure2所示。比如一开始某层CNN是以U作为输入的话,添加一个Spatial Transformer,该层的输入就变成V了。Spatial Transformer由Localisation Network、grid generator和sampler三个部分组成。
  • Localisation Network以特征图U为输入,输出一组参数
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值