Spatial Transformer Networks（STN）

最新推荐文章于 2024-08-29 12:41:05 发布

Francis_s

最新推荐文章于 2024-08-29 12:41:05 发布

阅读量131

点赞数

分类专栏： Master深度学习文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/francis_s/article/details/120608849

版权

Master深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

本文深入探讨了卷积神经网络（CNN）的平移不变性原理，解释了为何CNN能够在特征位置变化时仍能捕捉到它们。同时，介绍了空间变换网络（STN）的局部化网部分，该网络通过一系列层计算回归出参数，实现对图像的空间变换。STN的Grid Generator组件在其中起到关键作用，调整图像坐标以适应不同的变换需求。

摘要由CSDN通过智能技术生成

1. 首先要知道CNN具有平移不变性

这是为什么呢？可以回忆一下CNN都做了什么，第一就是卷积，第二就是maxpool。

当图像的某一个特征从左上角移动到右下角了，那我们CNN会不会受到影响呢？

因为我们卷积是整个图像都扫一遍，所以无论特征在哪里，我们的卷积核都会扫一遍，所以特征都会被采样到。

接着是maxpool，maxpool的作用就是将感受野里面的最大值给拿出来，其实也是卷积的作用，只不过是规则不同了，所以只要特征在上面卷积保留下来了，在maxpool这里也会被输出的。

所以不管特征在哪里，CNN都是把它给挖出来！

2. STN的结构

Localisation net
把原图作为输入，过连续若干层计算（如卷积、FC等），回归出参数 $\theta$ ，θ的维度取决于网络选择的具体变换类型,如选择仿射变换则 $\theta\subseteq R^{2*3}$ 。如选择投影变换则 $\theta\subseteq R^{3*3}$ 。θ的值决定了网络选择的空间变换的”幅度大小”

Grid generator:

放一下，后面更新

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spatial Transformer Networks（STN）

1. 首先要知道CNN具有平移不变性这是为什么呢？可以回忆一下CNN都做了什么，第一就是卷积，第二就是maxpool。当图像的某一个特征从左上角移动到右下角了，那我们CNN会不会受到影响呢？因为我们卷积是整个图像都扫一遍，所以无论特征在哪里，我们的卷积核都会扫一遍，所以特征都会被采样到。接着是maxpool，maxpool的作用就是将感受野里面的最大值给拿出来，其实也是卷积的作用，只不过是规则不同了，所以只要特征在上面卷积保留下...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。