【转载】项目实战—全景图像拼接(十六)

图像拼接是计算机视觉中最成功的应用之一。如今,很难找到不包含此功能的手机或图像处理API。在本次教程中,我们将讨论如何使用Python和OpenCV进行图像拼接。也就是,给定两张共享某些公共区域的图像,目标是“缝合”它们并创建一个全景图像场景。当然也可以是给定多张图像,但是总会转换成两张共享某些公共区域图像拼接的问题,因此我们将以最简单的形式进行介绍。

我们在之前已经讲过OpenCV的特征点的问题,今天我们将使用这些知识来完成图像的全景拼接。

我们需要拼接的两张图像如下:
在这里插入图片描述

给定上述一对图像,我们希望将它们缝合以创建全景场景。重要的是要注意,两个图像都需要有一些公共区域。当然,我们上面给出的两张图像时比较理想的,有时候两个图像虽然具有公共区域,但是同样还可能存在缩放、旋转、来自不同相机等因素的影响。但是无论哪种情况,我们都需要检测图像中的特征点。

关键点检测

最初的方法是使用诸如Harris Corners之类的算法来提取关键点。然后,我们可以尝试基于某种相似性度量(例如欧几里得距离)来匹配相应的关键点。众所周知,其有不错的特性:角点不变。这意味着,一旦检测到角点,即使旋转图像,该角点仍将存在。

但是,如果我们旋转然后缩放图像怎么办?在这种情况下,我们会很困难,因为角点的大小不变。也就是说,如果我们放大图像,先前检测到的角可能会变成一条线!

总而言之,我们需要旋转和缩放不变的特征。那就是更强大的方法(如SIFT,SURF和ORB)。

诸如SIFT和SURF之类的方法试图解决角点检测算法的局限性。通常,角点检测器算法使用固定大小的内核来检测图像上的感兴趣区域(角)。不难看出,当我们缩放图像时,该内核可能变得太小或太大。为了解决此限制,诸如SIFT之类的方法使用高斯差分(DoD)。想法是将DoD应用于同一图像的不同缩放版本。它还使用相邻像素信息来查找和完善关键点和相应的描述符。

首先,我们需要加载2个图像,一个查询图像和一个训练图像。最初,我们首先从两者中提取关键点和描述符。通过使用OpenCV detectAndCompute()函数,我们可以一步完成它。请注意,为了使用detectAndCompute(),我们需要一个关键点检测器和描述符对象的实例。它可以是ORB,SIFT或SURF等。此外,在将图像输入给detectAndCompute()之前,我们将其转换为灰度。

由于本次的项目并不难,我们先来看所有的代码,

view plaincopy to clipboardprint?
import numpy as np  
import cv2  
  
class Stitcher:  
  
    #拼接函数  
    def stitch(self, images, ratio=0.75, reprojThresh=4.0,showMatches=False):  
        #获取输入图片  
        (imageB, imageA) = images  
        #检测A、B图片的SIFT关键特征点,并计算特征描述子  
        (kpsA, featuresA) = self.detectAndDescribe(imageA)  
        (kpsB, featuresB) = self.detectAndDescribe(imageB)  
  
        # 匹配两张图片的所有特征点,返回匹配结果  
        M = self.matchKeypoints(kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh)  
  
        # 如果返回结果为空,没有匹配成功的特征点,退出算法  
        if M is None:  
            return None  
  
        # 否则,提取匹配结果  
        # H是3x3视角变换矩阵        
        (matches, H, status) = M  
        # 将图片A进行视角变换,result是变换后图片  
        result = cv2.warpPerspective(imageA, H, (imageA.shape[1] + imageB.shape[1], imageA.shape[0]))  
        self.cv_show('result', result)  
        # 将图片B传入result图片最左端  
        result[0:imageB.shape[0], 0:imageB.shape[1]] = imageB  
        self.cv_show('result', result)  
        # 检测是否需要显示图片匹配  
        if showMatches:  
            # 生成匹配图片  
            vis = self.drawMatches(imageA, imageB, kpsA, kpsB, matches, status)  
            # 返回结果  
            return (result, vis)  
  
        # 返回匹配结果  
        return result  
    def cv_show(self,name,img):  
        cv2.imshow(name, img)  
        cv2.waitKey(0)  
        cv2.destroyAllWindows()  
  
    def detectAndDescribe(self, image):  
        # 将彩色图片转换成灰度图  
        gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  
  
        # 建立SIFT生成器  
        descriptor = cv2.xfeatures2d.SIFT_create()  
        # 检测SIFT特征点,并计算描述子  
        (kps, features) = descriptor.detectAndCompute(image, None)  
  
        # 将结果转换成NumPy数组  
        kps = np.float32([kp.pt for kp in kps])  
  
        # 返回特征点集,及对应的描述特征  
        return (kps, features)  
  
    def matchKeypoints(self, kpsA, kpsB, featuresA, featuresB, ratio, reprojThresh):  
        # 建立暴力匹配器  
        matcher = cv2.BFMatcher()  
    
        # 使用KNN检测来自A、B图的SIFT特征匹配对,K=2  
        rawMatches = matcher.knnMatch(featuresA, featuresB, 2)  
  
        matches = []  
        for m in rawMatches:  
            # 当最近距离跟次近距离的比值小于ratio值时,保留此匹配对  
            if len(m) == 2 and m[0].distance < m[1].distance * ratio:  
            # 存储两个点在featuresA, featuresB中的索引值  
                matches.append((m[0].trainIdx, m[0].queryIdx))  
  
        # 当筛选后的匹配对大于4时,计算视角变换矩阵  
        if len(matches) > 4:  
            # 获取匹配对的点坐标  
            ptsA = np.float32([kpsA[i] for (_, i) in matches])  
            ptsB = np.float32([kpsB[i] for (i, _) in matches])  
  
            # 计算视角变换矩阵  
            (H, status) = cv2.findHomography(ptsA, ptsB, cv2.RANSAC, reprojThresh)  
  
            # 返回结果  
            return (matches, H, status)  
  
        # 如果匹配对小于4时,返回None  
        return None  
  
    def drawMatches(self, imageA, imageB, kpsA, kpsB, matches, status):  
        # 初始化可视化图片,将A、B图左右连接到一起  
        (hA, wA) = imageA.shape[:2]  
        (hB, wB) = imageB.shape[:2]  
        vis = np.zeros((max(hA, hB), wA + wB, 3), dtype="uint8")  
        vis[0:hA, 0:wA] = imageA  
        vis[0:hB, wA:] = imageB  
  
        # 联合遍历,画出匹配对  
        for ((trainIdx, queryIdx), s) in zip(matches, status):  
            # 当点对匹配成功时,画到可视化图上  
            if s == 1:  
                # 画出匹配对  
                ptA = (int(kpsA[queryIdx][0]), int(kpsA[queryIdx][1]))  
                ptB = (int(kpsB[trainIdx][0]) + wA, int(kpsB[trainIdx][1]))  
                cv2.line(vis, ptA, ptB, (0, 255, 0), 1)  
  
        # 返回可视化结果  
        return vis  
imageA = cv2.imread("left_01.png")  
imageB = cv2.imread("right_01.png")  
  
# 把图片拼接成全景图  
stitcher = Stitcher()  
(result, vis) = stitcher.stitch([imageA, imageB], showMatches=True)  
  
# 显示所有图片  
cv2.imshow("Image A", imageA)  
cv2.imshow("Image B", imageB)  
cv2.imshow("Keypoint Matches", vis)  
cv2.imshow("Result", result)  
cv2.waitKey(0)  
cv2.destroyAllWindows()  

先看特征点的匹配结果:
在这里插入图片描述
在匹配之后,可以对图像进行处理:
在这里插入图片描述
这样看着很别扭,接下来是对其进行合并,并进行Transfrom变换:
在这里插入图片描述
可以看到,全景图像已经拼接完成了。效果还是非常不错的,大家可以尝试使用其他的特征算法来进行试验。
查看文章汇总页https://blog.csdn.net/weixin_44237705/article/details/107864965
更多openvino技术信息可以入群交流~
申请备注:CSDN
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
压缩包中包含的具体内容: 对给定数据中的6个不同场景图像,进行全景拼接操作,具体要求如下: (1) 寻找关键点,获取关键点的位置和尺度信息(DoG检测子已由KeypointDetect文件夹中的detect_features_DoG.m文件实现;请参照该算子,自行编写程序实现Harris-Laplacian检测子)。 (2) 在每一幅图像中,对每个关键点提取待拼接图像的SIFT描述子(编辑SIFTDescriptor.m文件实现该操作,运行EvaluateSIFTDescriptor.m文件检查实现结果)。 (3) 比较来自两幅不同图像的SIFT描述子,寻找匹配关键点(编辑SIFTSimpleMatcher.m文件计算两幅图像SIFT描述子间的Euclidean距离,实现该操作,运行EvaluateSIFTMatcher.m文件检查实现结果)。 (4) 基于图像中的匹配关键点,对两幅图像进行配准。请分别采用最小二乘方法(编辑ComputeAffineMatrix.m文件实现该操作,运行EvaluateAffineMatrix.m文件检查实现结果)和RANSAC方法估计两幅图像间的变换矩阵(编辑RANSACFit.m 文件中的ComputeError()函数实现该操作,运行TransformationTester.m文件检查实现结果)。 (5) 基于变换矩阵,对其中一幅图像进行变换处理,将其与另一幅图像进行拼接。 (6) 对同一场景的多幅图像进行上述操作,实现场景的全景拼接(编辑MultipleStitch.m文件中的makeTransformToReferenceFrame函数实现该操作)。可以运行StitchTester.m查看拼接结果。 (7) 请比较DoG检测子和Harris-Laplacian检测子的实验结果。图像拼接的效果对实验数据中的几个场景效果不同,请分析原因。 已经实现这些功能,并且编译运行均不报错!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值