STN
不想待在银河系
这个作者很懒,什么都没留下…
展开
-
[论文理解&代码解读]Inverse Compositional Spatial Transformer Networks(IC-STN)
1. IC-STN模型本质如图1,STN是将输入图像用一个几何预测器预测校正参数p,把p作用在输入图像IinI_{in}Iin就得到了修正后的图像IoutI_{out}Iout。在STN原来的论文中,几何预测器可以展开为图2的样子。图1:STN的工作原理图2 STN内部结构和STN不同的是,IC-STN是把扭曲参数(warp parameter)p显式地提取了出来,并且对p进行若干次迭代,类似RNN迭代的思想。其流程如图3所示。论文作者的实验表明,这样能进一步增加准确率。图3 IC-原创 2020-11-16 12:07:46 · 977 阅读 · 0 评论 -
[论文翻译]A 3D Spatial Transformer Network Approach in Unconstrained Poses(人脸识别3D-STN)
0 摘要面部对齐包括在已知语义的图像上找到一组标志点。然而,这种地标点的语义在2D方法中常常丢失,在2D方法中,landmarks要么移动到可见的边界,要么随着人脸姿态的变化而被忽略。为了在大姿态下提取一致的对齐点,在对齐步骤中必须考虑人脸的三维结构。然而,从单个二维图像中提取三维结构通常首先需要对齐。我们提出了一种新的方法,通过三维空间变换网络(3D-STN)同时提取人脸的三维形状和语义上一致的二维对齐,从而对三维模型的摄像机投影矩阵和翘曲参数进行建模。通过使用一个通用的三维模型和一个薄板样条(TPS.翻译 2020-11-02 11:32:20 · 1188 阅读 · 3 评论 -
[论文翻译]:Spatial Transformer Generative Adversarial Networks for Image Compositing(STN-GAN)
0 摘要我们解决的问题是找到对前景对象的逼真的几何校正,以使其在合成为背景图像时看起来自然。为此,我们提出了一种使用STNs的新的GAN( Generative Adversarial Network)结构,我们称之为ST-GAN。ST-GAN通过在geometric warp parameter space空间中进行操作来寻求图像逼真度。ST-GAN的主要优势之一是其间接适用于高分辨率图像,因为预测的warp parameter可在参考帧(reference frame)之间传递。我们在两种应用中演示.翻译 2020-10-31 23:14:05 · 878 阅读 · 0 评论 -
[论文翻译]Recurrent Spatial Transformer Networks(RNN-STN)
0. 摘要我们将STN与RNN结合,提出了RNN-STN模型,并用该模型进行MNIST手写数字识别。该模型单数字的错误在1.5%,相比之下CNN的错误率在2.9%,STN的错误率为2.0%。 STN能输出放大、旋转和倾斜的输入图像。 我们研究了STN的不同下采样因子(输入和输出像素比),表明RNN-STN模型能够在不恶化性能的情况下对输入图像进行下采样。在RNN-STN中的下采样可以被认为是自适应下采样,以最小化感兴趣区域的信息丢失。 我们将RNN-STN的优越性能归因于它可以处理一系列感兴趣的区域。.翻译 2020-11-01 11:23:37 · 737 阅读 · 0 评论