全景图像拼接

最新推荐文章于 2023-08-10 15:42:19 发布

701044

最新推荐文章于 2023-08-10 15:42:19 发布

阅读量1.4k

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_41258131/article/details/131409170

版权

提示：文章用于学习记录

文章目录

前言
一、效果展示
二、算法步骤
三、代码编写
- 3.1 Panorama.py
- 3.2 stitch.py
四、关键步骤
总结

前言

图像拼接技术旨在将两张或多张存在重叠区域的图像，拼接成一幅无明显缝合线的全景图像。
参考【Computer Vision实战】一、使用OpenCV进行图像全景拼接（基于Python3）
【视频处理】视频拼接&视频缝合手把手教你

一、效果展示

ImageA
ImageA
在这里插入图片描述

二、算法步骤

图像预处理：对于每个输入图像，进行预处理操作，如图像去噪、图像校正等。这些操作有助于提高拼接的质量；
特征提取：使用特征提取算法（如SIFT、SURF或ORB）在每个输入图像中检测关键点，并计算每个关键点的描述子。这些描述子是用来描述关键点周围图像区域的向量；
特征匹配：通过比较两幅图像的特征描述子，使用匹配算法（如最近邻匹配、最佳邻域匹配或RANSAC）来找到在两幅图像之间匹配的关键点对；
图像配准：使用匹配的关键点对进行图像配准，即将不同图像的对应区域对齐。常用的配准方法包括仿射变换和透视变换；
图像融合：将配准后的图像进行融合，生成全景图像。常见的融合方法包括平均融合、加权融合和多重分辨率融合；
全景图像后处理：对生成的全景图像进行后处理，如色彩校正、去除拼接痕迹等，以进一步提升拼接结果的质量。

三、代码编写

3.1 Panorama.py

该代码段是一个名为 Stitcher 的类，用于图像拼接；
在类的初始化方法__init__()中，判断是否使用的是OpenCV的版本3.x或更高版本；
首先通过 imutils.is_cv3() 是一个imutils库中的函数调用，确定是否使用的是 OpenCV 3.X 版本或更高版本，并将结果保存在 self.isv3 变量中。
is_cv3() 函数用于检查 OpenCV 的版本，如果传入参数 or_better=True，则表示检查是否为 OpenCV 3.X 或更高版本。
通过设置 self.isv3 的值，后续的代码可以根据 OpenCV 的版本进行不同的处理，以确保代码在不同版本的 OpenCV 上能够正常运行。

# 导入必要的包
import numpy as np
import imutils
import cv2

class Stitcher:
    def __init__(self):
        # 确定是否使用的是OpenCV v3.X
        self.isv3 = imutils.is_cv3(or_better=True)

这段代码是一个类方法 stitch，用于拼接两个图像成为全景图像，接受以下参数：
images：包含两个输入图像的元组（imageA, imageB）；
ratio：特征匹配时的匹配比例阈值，默认为 0.75；
reprojThresh：RANSAC 过程中的重投影误差阈值，默认为 4.0；
showMatches：一个布尔值，指示是否在输出中包含匹配的可视化结果，默认为 False；

解包 images 元组，将第二个图像（imageB）赋值给 imageB，第一个图像（imageA）赋值给 imageA；
调用类中的 detectAndDescribe 方法，对图像 imageA 进行特征检测和描述子提取，返回关键点 (kpsA) 和特征描述子 (featuresA)；
同样，对图像 imageB 进行特征检测和描述子提取，返回关键点 (kpsB) 和特征描述子 (featuresB)。

调用类中的 matchKeypoints 方法，对两幅图像的特征进行匹配，返回匹配结果 (M)；参数包括两幅图像的关键点、特征描述子，以及匹配比例阈值和重投影误差阈值。

如果匹配结果 M 为空（即没有足够的匹配关键点来创建全景图像），则返回 None，表示拼接失败。

解包匹配结果 M，得到匹配的关键点对 (matches)、透视变换矩阵 (H) 和匹配状态 (status)。
使用透视变换矩阵 H 对图像 imageA 进行透视变换，生成拼接后的图像 result。
目标图像的大小是将 imageA 和 imageB 的宽度相加，高度保持不变
将图像 imageB 复制到拼接图像 result 的对应位置，实现图像的拼接；这里将 imageB 复制到 result 的左上角，覆盖了部分 imageA。

如果 showMatches 参数为 True，即需要显示匹配的可视化结果。

调用类中的 drawMatches 方法，用于绘制匹配关键点的可视化结果；参数包括两幅图像、关键点、匹配关键点对和匹配状态。

返回拼接后的图像 result 和匹配可视化结果 vis 的元组。

返回拼接后的图像 result，表示拼接成功。
这段代码的主要功能是将两幅输入图像进行特征提取、特征匹配和图像拼接，生成全景图像。如果指定了 showMatches 参数为 True，则还会返回匹配关键点的可视化结果。

    def stitch(self, images, ratio=0.75, reprojThresh=4.0,
               showMatches=False):
        # unpack the images, then detect keypoints and extract
        # local invariant descriptors from them
        (imageB, imageA) = images
        (kpsA, featuresA) = self.detectAndDescribe(imageA)
        (kpsB, featuresB) = self.detectAndDescribe(imageB)
        # match features between the two images
        M = self.matchKeypoints(kpsA, kpsB,
                                featuresA, featuresB, ratio, reprojThresh)
        # if the match is None, then there aren't enough matched
        # keypoints to create a panorama
        if M is None:
            return None

        # otherwise, apply a perspective warp to stitch the images
        # together
        (matches, H, status) = M
        result = cv2.warpPerspective(imageA, H,
                                     (imageA.shape[1] + imageB.shape[1], imageA.shape[0]))
        result[0:imageB.shape[0], 0:imageB.shape[1]] = imageB
        # check to see if the keypoint matches should be visualized
        if showMatches:
            vis = self.drawMatches(imageA, imageB, kpsA, kpsB, matches,
                                   status)
            # return a tuple of the stitched image and the
            # visualization——
            return (result, vis)
        # return the stitched image
        return result

这段代码是一个类方法 detectAndDescribe，用于在图像中检测关键点并提取特征描述子：
将输入的彩色图像 image 转换为灰度图像 gray，这是因为大多数特征提取算法在灰度图像上运行效果更好；

判断是否使用的是 OpenCV 3.x 或更高版本，根据 OpenCV 版本选择适当的 SIFT 特征提取器。
	OpenCV 3.x 使用 cv2.xfeatures2d.SIFT_create()
	OpenCV 2.4.x 使用 cv2.SIFT_create()
使用 SIFT 特征提取器在图像 image 上检测关键点并计算特征描述子；
detectAndCompute 方法返回关键点 (kps) 和特征描述子 (features)；

如果使用的是 OpenCV 2.4.x 版本
创建一个 SIFT 特征检测器；
在灰度图像 gray 上检测关键点，返回关键点列表 kps；
创建一个 SIFT 特征提取器
使用 SIFT 特征提取器提取图像 gray 中关键点 kps 对应的特征描述子 features。
将关键点对象中的坐标转换为 NumPy 数组。

返回关键点 kps 和特征描述子 features 的元组。
这段代码的主要功能是根据不同的 OpenCV 版本选择适当的特征提取器和特征描述子提取方法，并返回图像中检测到的关键点和对应的特征描述子。

    def detectAndDescribe(self, image):
        # convert the image to grayscale
        gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
        # check to see if we are using OpenCV 3.X
        if self.isv3:
            # detect and extract features from the image
            # 根据 OpenCV 版本选择适当的 SIFT 特征提取器
            # descriptor = cv2.xfeatures2d.SIFT_create()   # OpenCV 3.x 使用
            descriptor = cv2.SIFT_create()    # OpenCV 2.4.x 使用
            (kps, features) = descriptor.detectAndCompute(image, None)
        # otherwise, we are using OpenCV 2.4.X
        else:
            # detect keypoints in the image
            detector = cv2.FeatureDetector_create("SIFT")
            kps = detector.detect(gray)
            # extract features from the image
            extractor = cv2.DescriptorExtractor_create("SIFT")
            (kps, features) = extractor.compute(gray, kps)
        # convert the keypoints from KeyPoint objects to NumPy
        # arrays
        kps = np.float32([kp.pt for kp in kps])
        # return a tuple of keypoints and features
        return (kps, features)

这段代码是一个类方法 matchKeypoints，用于对两组关键点和特征描述子进行特征匹配：

创建一个 Brute-Force 特征匹配器。
Brute-Force 匹配器会计算特征之间的欧氏距离，并返回最匹配的特征。
使用特征匹配器对两组特征描述子进行匹配。
knnMatch 方法返回每个特征描述子的最佳两个匹配结果（k=2）。

初始化实际匹配结果的列表。
遍历所有原始匹配结果。
检查匹配结果是否满足 Lowe's ratio test。
只有当匹配结果有两个，并且第一个匹配的距离小于第二个匹配的距离乘以给定的比例阈值 ratio 时，才被认为是有效匹配。
将有效匹配的训练索引和查询索引添加到匹配列表中。

注意索引的顺序。
如果有效匹配的数量大于 4（至少需要 4 个匹配点才能计算出单应性矩阵）。
构建匹配点对应的第一组点集。
从关键点 kpsA 中根据匹配列表中的训练索引获取点的坐标，并将其转换为 NumPy 数组。
构建匹配点对应的第二组点集。
从关键点 kpsB 中根据匹配列表中的查询索引获取点的坐标，并将其转换为 NumPy 数组。

使用 RANSAC 算法计算两组点集之间的单应性矩阵 H。
reprojThresh 是重投影误差阈值，用于排除外点。
返回匹配列表、单应性矩阵 H 和每个匹配点的状态。

    def matchKeypoints(self, kpsA, kpsB, featuresA, featuresB,
                       ratio, reprojThresh):
        # compute the raw matches and initialize the list of actual
        # matches
        matcher = cv2.DescriptorMatcher_create("BruteForce")
        rawMatches = matcher.knnMatch(featuresA, featuresB, 2)
        matches = []
        # loop over the raw matches
        for m in rawMatches:
            # ensure the distance is within a certain ratio of each
            # other (i.e. Lowe's ratio test)
            if len(m) == 2 and m[0].distance < m[1].distance * ratio:
                matches.append((m[0].trainIdx, m[0].queryIdx))

        # computing a homography requires at least 4 matches
        if len(matches) > 4:
            # construct the two sets of points
            ptsA = np.float32([kpsA[i] for (_, i) in matches])
            ptsB = np.float32([kpsB[i] for (i, _) in matches])
            # compute the homography between the two sets of points
            (H, status) = cv2.findHomography(ptsA, ptsB, cv2.RANSAC,
                                             reprojThresh)
            # return the matches along with the homograpy matrix
            # and status of each matched point
            return (matches, H, status)
        # otherwise, no homograpy could be computed
        return None

这段代码是一个类方法 drawMatches，用于绘制匹配关键点的可视化结果：
获取图像 imageA 和 imageB 的高度和宽度；
创建一个用于可视化的输出图像 vis，大小为两幅图像高度的最大值和两幅图像宽度之和；
数据类型为无符号 8 位整数 (uint8)；
将图像 imageA 和 imageB 分别复制到可视化图像 vis 的左侧和右侧，
vis[0:hA, 0:wA] 表示将 imageA 复制到 vis 的左上角，
vis[0:hB, wA:] 表示将 imageB 复制到 vis 的右上角，

遍历所有匹配关键点和匹配状态的元组；
只处理匹配状态为 1（成功匹配）的关键点；
获取匹配关键点在图像上的坐标，
ptA 表示查询图像 imageA 中的关键点坐标，
ptB 表示训练图像 imageB 中的关键点坐标，并根据 wA 的偏移量调整；
在可视化图像 vis 上绘制一条连接匹配关键点的线段，
线段起点为 ptA，终点为 ptB；
(0, 255, 0) 是线段的颜色，这里为绿色，1 是线段的线宽；
返回绘制了匹配关键点的可视化图像 vis；
这段代码的主要功能是创建一个空的可视化图像，然后根据匹配关键点的坐标在图像上绘制连接线段，最后返回绘制了匹配关键点的可视化结果。

    def drawMatches(self, imageA, imageB, kpsA, kpsB, matches, status):
        # initialize the output visualization image
        (hA, wA) = imageA.shape[:2]
        (hB, wB) = imageB.shape[:2]
        vis = np.zeros((max(hA, hB), wA + wB, 3), dtype="uint8")
        vis[0:hA, 0:wA] = imageA
        vis[0:hB, wA:] = imageB
        # loop over the matches
        for ((trainIdx, queryIdx), s) in zip(matches, status):
            # only process the match if the keypoint was successfully
            # matched
            if s == 1:
                # draw the match
                ptA = (int(kpsA[queryIdx][0]), int(kpsA[queryIdx][1]))
                ptB = (int(kpsB[trainIdx][0]) + wA, int(kpsB[trainIdx][1]))
                cv2.line(vis, ptA, ptB, (0, 255, 0), 1)
        # return the visualization
        return vis

3.2 stitch.py

这段代码实现了全景图拼接的主要流程：
导入自定义的 Stitcher 类，用于图像拼接，导入所需的 Python 模块；

创建一个参数解析器对象 ap。
添加命令行参数 -f 和 -s，用于指定要拼接的第一张图像和第二张图像的路径。
--first 和 --second 是对应参数的完整名称，required=True 表示这两个参数是必需的，help 参数用于提供关于参数用途的帮助信息；

解析命令行参数，并将其存储在字典 args 中。

使用 OpenCV 的 imread 函数加载第一张图像和第二张图像，图像的路径从 args 字典中获取；
使用 imutils.resize 函数调整图像的宽度为 400 像素，以加快后续处理速度。

创建一个 Stitcher 对象，用于执行图像拼接。

调用 stitcher 对象的 stitch 方法，将图像 imageA 和 imageB 进行拼接。
showMatches=True 表示在拼接过程中可视化关键点匹配。

使用 OpenCV 的 imshow 函数显示图像。
"Image A"、"Image B"、"Keypoint Matches" 和 "Result" 是显示窗口的标题。
imageA、imageB、vis 和 result 是要显示的图像。

等待键盘输入，直到任意键被按下，这会保持图像窗口的显示状态。

# import the necessary packages
from Panorama import Stitcher
import argparse
import imutils
import cv2

# construct the argument parse and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-f", "--first", required=True,
                help="path to the first image")
ap.add_argument("-s", "--second", required=True,
                help="path to the second image")
args = vars(ap.parse_args())

# load the two images and resize them to have a width of 400 pixels
# (for faster processing)
imageA = cv2.imread(args["first"])
imageB = cv2.imread(args["second"])
imageA = imutils.resize(imageA, width=400)
imageB = imutils.resize(imageB, width=400)
# stitch the images together to create a panorama
stitcher = Stitcher()
(result, vis) = stitcher.stitch([imageA, imageB], showMatches=True)
# show the images
cv2.imshow("Image A", imageA)
cv2.imshow("Image B", imageB)
cv2.imshow("Keypoint Matches", vis)
cv2.imshow("Result", result)
cv2.waitKey(0)

该代码通过命令行参数指定要拼接的两张图像，然后加载图像并进行预处理；
接下来，使用自定义的 Stitcher 类执行图像拼接操作：
首先，创建 Stitcher 对象 stitcher；然后，调用 stitch 方法，将图像 imageA 和 imageB 作为参数传递给它进行拼接，showMatches=True 表示在拼接过程中可视化关键点匹配；
拼接完成后，将拼接结果存储在 result 中，将可视化结果存储在 vis 中；
接下来，使用 OpenCV 的 imshow 函数显示图像，cv2.imshow("Image A", imageA) 显示第一张图像，cv2.imshow("Image B", imageB) 显示第二张图像；
cv2.imshow("Keypoint Matches", vis) 显示关键点匹配可视化结果;
cv2.imshow("Result", result) 显示拼接结果;
最后，使用 cv2.waitKey(0) 等待键盘输入，直到任意键被按下，这样可以保持图像窗口的显示状态。

四、关键步骤

4.1 关键点检测和局部不变描述符提取

首先，将输入的图像转换为灰度图像；然后，使用特征检测算法（如SIFT、SURF、ORB等）检测图像中的关键点；

SIFT（尺度不变特征变换）：
SIFT 算法在不同尺度和旋转下检测图像中的关键点；
它使用高斯差分金字塔来寻找具有较大梯度幅值的极值点作为候选关键点；
对候选关键点进行精确定位和方向分配，并计算局部图像区域的描述符；
SURF（加速稳健特征）：
SURF 算法采用了一种基于积分图像的快速计算方法；
它使用盒状滤波器对图像进行多尺度空间滤波，检测具有较大Hessian矩阵响应的关键点；
对关键点进行精确定位和方向分配，并计算描述符；
ORB（方向鲁棒的二进制描述符）：
ORB 算法结合了 FAST 关键点检测器和 BRIEF 描述符；
它采用了快速特征检测和计算高效二进制描述符的策略；
ORB 算法具有较快的速度和良好的性能，特别适用于实时应用；

对于每个关键点，计算其局部区域的特征描述符。最终，得到每个关键点的位置和对应的特征描述符。

4.2 关键点匹配

在给定两个图像的特征描述子（例如SIFT、SURF或ORB）之后，关键点匹配的一般步骤如下：

首先，使用特征检测算法（如SIFT、SURF、ORB等）在两个图像中分别检测出特征点。每个特征点通常由其位置（x, y坐标）和一些局部特征描述子（例如特征向量）表示；
接下来，通过比较两个图像中特征点的描述子，计算它们之间的相似度或距离。常用的方法包括欧氏距离、汉明距离、余弦相似度等；
根据相似度或距离的度量，对特征点进行匹配。通常采用最近邻匹配（Nearest Neighbor）的方法，即将一个特征点与另一个图像中最相似的特征点进行匹配；
为了提高匹配的准确性，可以使用比率测试（Ratio Test）来筛选匹配结果；
比率测试将最近邻距离与次近邻距离进行比较，如果两者之间的比值小于一个阈值，则认为该匹配是可靠的；
根据匹配结果，可以获取两个图像之间的关键点匹配对，每个匹配对包含两个特征点的位置信息。

4.3 RANSAC（随机抽样一致性）

通过 RANSAC 算法对关键点匹配进行筛选，去除错误的匹配；
随机选择一组关键点匹配，估计两个图像之间的透视变换矩阵（即单应性矩阵）；
使用估计的透视变换矩阵将一个图像上的点转换到另一个图像上，计算其重投影误差；
根据设定的阈值，判断匹配是否为内点（符合透视变换）或外点（不符合透视变换）；
重复上述步骤多次，选择具有最大内点数的透视变换矩阵作为最终的变换矩阵。

4.4 透视变换：

使用估计的透视变换矩阵，对其中一个图像进行透视变换，将其与另一个图像进行对齐；
创建一个新的空白画布，大小适合容纳两个图像的拼接结果；
对其中一个图像进行透视变换，将其映射到新的画布上；
将另一个图像直接复制到新的画布上的对应位置；
两个图像的重叠区域会进行融合或叠加处理，形成最终的全景图像。

总结

以上步骤是全景拼接算法的核心流程，通过检测关键点、提取描述符、匹配关键点、RANSAC 筛选和透视变换，实现将多个图像拼接成全景图像。