[论文理解&代码解读]Inverse Compositional Spatial Transformer Networks（IC-STN）

最新推荐文章于 2023-12-07 09:08:20 发布

不想待在银河系

最新推荐文章于 2023-12-07 09:08:20 发布

阅读量1k

点赞数

分类专栏： STN 文章标签：卷积深度学习计算机视觉 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bxdzyhx/article/details/109716441

版权

本文深入解析Inverse Compositional Spatial Transformer Networks（IC-STN），与STN的区别在于它显式提取并迭代扭曲参数，提高准确性。通过pytorch代码解读，包括options.py、data.py、warp.py等部分，展示了IC-STN如何工作以及其在图像变换中的应用。

摘要由CSDN通过智能技术生成

1. IC-STN模型本质

如图1，STN是将输入图像用一个几何预测器预测校正参数p，把p作用在输入图像 $I_{in}$ 就得到了修正后的图像 $I_{out}$ 。在STN原来的论文中，几何预测器可以展开为图2的样子。
在这里插入图片描述

图1：STN的工作原理

在这里插入图片描述

图2 STN内部结构

和STN不同的是，IC-STN是把扭曲参数（warp parameter）p显式地提取了出来，并且对p进行若干次迭代，类似RNN迭代的思想。其流程如图3所示。论文作者的实验表明，这样能进一步增加准确率。

在这里插入图片描述

图3 IC-STN

在这里插入图片描述

图4 IC-STN和其他模型准确率对比

IC-STN的作者说他们从IC-LK算法中获得了启发，解释了很多字，说了很多废话，其实重点不在那里，可以不用太多地关注。

2. IC-STN代码解读

pytorch代码地址在这，里面也有tensorflow的版本。此外，IC-STN代码中的难点在于理解投影变换的代码，如果和我一样没什么基础的话，可以先看看这篇知乎回答。

下面会一个个部分讲解我对pytorch代码的理解，建议结合源代码查看（代码很长，我就不贴上来了）。

2.1 options.py 部分

里面存放了很多预设参数
opt = options()
参数都可以通过opt.xxx 来调用

2.2 data.py 部分

def loadMNIST(opt, path)
用于加载MNIST数据集

def makeBatch(opt, data)
制作一个batch

def evalTest(opt, data, geometric, classifier)
评估准确率，后面解释geometric和classifier

def genPerturbations(opt)
生成初始的warp parameter
return pInit

里面有个细节，如下

pPert = np.matmul(np.linalg.inv(np.matmul(Jtransp, J)), np.matmul(Jtransp, dXY)).squeeze()

翻译成公式，作者

最低0.47元/天解锁文章

不想待在银河系

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。