【图像拼接】论文精读:As-Projective-As-Possible Image Stitching with Moving DLT(APAP)

129 篇文章 58 订阅 ¥179.90 ¥99.00

本文对应的论文源码精读:

【图像拼接】源码精读:As-Projective-As-Possible Image Stitching with Moving DLT(APAP)第一部分:全局单应Global homography

【图像拼接】源码精读:As-Projective-As-Possible Image Stitching with Moving DLT(APAP)第二部分:mdlt

图像拼接系列相关论文精读

  1. Seam Carving for Content-Aware Image Resizing
  2. As-Rigid-As-Possible Shape Manipulation
  3. Adaptive As-Natural-As-Possible Image Stitching
  4. Shape-Preserving Half-Projective Warps for Image Stitching
  5. Seam-Driven Image Stitching
  6. Parallax-tolerant Image Stitching
  7. Parallax-Tolerant Image Stitching Based on Robust Elastic Warping
  8. SuperPoint: Self-Supervised Interest Point Detection and Description

APAP项目主页,包括代码数据等:https://cs.adelaide.edu.au/~tjchin/apap/


摘要

大名鼎鼎的APAP。

主要思想:单一投影矩阵只适用于二维平面和旋转的情况,对于扭曲图像会出现重影和明显的视差,拼接线等不好的视觉效果。本文的关键就是得到全局投影,平滑拼接,使用的去重影算法就是MDLT,使用网格划分的方式无缝配准。

关键词:图像拼接,投影扭曲,全局投影,MDLT,网格。

DLT:direct linear transform 直接线性变换

应该是使用网格算法来进行图像拼接的开山之作。

1.APAP总体实现流程

  1. 提取两张图片的sift特征点

SIFT:尺度不变特征变换(Scale-invariant feature transform)
在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量

  1. 对两张图片的特征点进行匹配

用cv2的knn或者vlfeat十分方便,有的sift库可能因版权限制不能使用

  1. RANSAC的改进算法筛选特征点,使筛选后的点能一一对应,无匹配错误

RANSAC:Random Sample Consensus随机样本一致:有目的的得到目标数据

  1. 使用DLT,将剩下的特征点进行透视变换矩阵估计。
  2. 将图像网格划分,每个网格逐一估计。

2.APAP

2.1 投影扭曲

这部分就是计算3*3单应矩阵H的过程。如下图。
请添加图片描述

2.2 移动DLT

重点是这部分。

当两张图片不只是通过旋转相机或不在同一平面时,用投影扭曲不可避免会产生伪影。为了减少伪影现象,就是给每一个网格使用一个独立的局部单应。其实就是多加了一个权重w,之前是Ah,现在是WAh。权重由每个像素与该像素格子左上角的距离确定。

论文中的公式11:
w ∗ i = m a x ( e x p ( − ∣ ∣ x ∗ − x ∣ ∣ 2 / σ 2 ) , γ ) . (11) w_*^i = max(exp(-||x_*-x_||^2/\sigma^2),\gamma).\tag{11} wi=max(exp(∣∣xx2/σ2),γ).(11)
其中gamma是在0-1之间的一个很小的值,gamma趋近于1,每个网格的局部单应就变成了整体的全局单应。

3.高效学习图像拼接

首先是使用RANSAC,用DLT算出全局单应的最小解。阐述了RANSAC的重要,因为outliers的错误要比inlier错误严重的多。这是个很重要的思想:就是内点可以少也可以有错误,但是外点匹配错误必须尽可能避免。

分成cells

将所有像素点作为一个cell太浪费了,因为相邻位置实际上计算的是相同的单应。分成C1*C2,网格中心作为每个网格扭曲的点。

更新SVD权重

更新SVD不用重头计算。具体的代码中详述。

4.results

比较不同的方法,也测试了不同大小的图像。
主要是一些超参数的值选择。还有RMSE定量指标。
γ ∈ [ 0.0025 , 0.025 ] \gamma \in [0.0025,0.025] γ[0.0025,0.025],网格控制在5050-100100之间。

5.实验结果

在这里插入图片描述
明显比全局单应效果更好。

论文中图1可视化复现

请添加图片描述

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

十小大

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值