论文阅读笔记|A view-free image stitching network

最新推荐文章于 2024-02-18 08:31:45 发布

金渐层猫

最新推荐文章于 2024-02-18 08:31:45 发布

阅读量1.4k

点赞数 4

分类专栏：图像拼接

本文链接：https://blog.csdn.net/weixin_43917574/article/details/107940255

版权

图像拼接专栏收录该内容

5 篇文章

订阅专栏

论文阅读笔记|A view-free image stitching network based on global homography

前言
VFISNet
数据集生成
实验

前言

L. Nie, C. Lin, K. Liao, M. Liu, and Y. Zhao, “A view-free image stitching network based on global homography,” Journal of Visual Communication and Image Representation, p. 102950, 2020.
本文提出了一种基于全局单应性的视角自由的图像拼接网络，简称VFISNet，
源码地址
算法框架如图所示：
在这里插入图片描述
主要包括三个阶段：

Homography Estimation
Structure Stitching
Content Revision

本文的主要贡献：

提出了一个视角自由的图像拼接网络
为了尽可能减轻伪影，设计了一个global correlation层和一个结构到内容逐渐拼接模块
构造了一个图像拼接合成数据集，图像之间的重叠区域更小

VFISNet

Homography estimation stage

在这里插入图片描述
单应性估计阶段就是基于先前的DHN方法，一个VGG风格的特征提取骨干网络。接着为了减小平均角点误差，提升单应性估计精度，从光流估计方法(PWC-Net、Flownet2等)得到启发，作者引入了一个Global Correlation层，然后接了三个卷积层和两个全连接层，输出是8个参数的 $f$ ，表示图像 I_B 相对于图像 I_A 四个顶点的偏移量。再通过DLT层计算出图像 I_B 变换到图像 I_A 的单应性矩阵H。

Structure stitching stage

在这里插入图片描述
结构拼接阶段是基于空间变换网络。对于I_A，使用单位矩阵，变换为I_AW；对于I_B，使用单应性估计阶段得到的H，变换为I_BW，I_AW和I_BW通过平均融合得到Structure Stitching Result。再将I_AW、I_BW、Structure Stitching Result连接得到一个9通道的图像。此时得到的是一个粗对齐拼接结果，因为单应性估计是从图像四个顶点的偏移量计算出，不会将每个像素对齐，一点预测误差就会导致整个拼接结果视觉上的模糊。