目标检测之网络篇(2)【STN-空间变换网络】

空间变换网络(STN)是DeepMind提出的一种技术,用于改善CNN的平移不变性。STN由参数预测、坐标映射和像素采集三部分组成,通过端到端训练消除图像变形,增强模型的识别效率。它可以作为一个模块插入到CNN中,学习自适应的空间变换,提升目标检测和分类任务的性能。
摘要由CSDN通过智能技术生成

1. STN是什么

STN:Spatial Transformer Networks,即空间变换网络,是Google旗下 DeepMind 公司的研究成果。该论文提出空间变换网络STN,分为参数预测坐标映射像素采集三大部分,可以插入到现有的CNN模型中。通过对数据进行反向空间变换来消除图片上目标的变形,从而使得分类网络的识别更加简单高效。
在我的理解里,STN是一个可以放置在CNN前面,或嵌入到CNN其中的某一环节的模块(空间变形器)。

2. 问题的提出——CNN的平移不变性

CNN在图像分类中取得了显著的成效,主要是得益于 CNN 的深层结构具有空间不变性(spatially invariance)(平移不变性,旋转不变性),所以图像上的目标物体就算是做了平移或者旋转,CNN仍然能够准确的识别出来,这对于CNN的泛化能力是有益的。
在这里插入图片描述
传统CNN中使用卷积和池化操作在一定程度上实现了平移不变性,但这种人工设定的变换规则使得网络过分的依赖先验知识,既不能真正实现平移不变性(不变性对于平移的要求很高),又使得CNN对于旋转,扭曲等未人为设定的几何变换缺乏应有的特征不变性。因此提出了STN,具有以下特点:
(1) 为每一个输入提供一种对应的空间变换方式(如仿射变换)
(2) 变换作用于整个特征输入
(3) 变换的方式包括缩放、剪切、旋转

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值