python 深度 视差 计算_OpenCV-Python 立体图像的深度图 | 五十二

本文介绍如何使用OpenCV库基于立体图像计算深度图。通过理解对极几何和视差原理,利用StereoBM方法找到匹配点,然后计算差异。代码示例展示了创建视差图的过程,并讨论了相关参数的调整以优化结果。
摘要由CSDN通过智能技术生成

目标

在本节中,

我们将学习根据立体图像创建深度图。

基础

在上一节中,我们看到了对极约束和其他相关术语等基本概念。我们还看到,如果我们有两个场景相同的图像,则可以通过直观的方式从中获取深度信息。下面是一张图片和一些简单的数学公式证明了这种想法。

上图包含等效三角形。编写它们的等式将产生以下结果:

d i s p a r i t y = x − x ′ = B f Z disparity = x - x' = \frac{Bf}{Z}disparity=x−x′=ZBf​

x xx和x ′ x'x′是图像平面中与场景点3D相对应的点与其相机中心之间的距离。B BB是两个摄像机之间的距离(我们知道),f ff是摄像机的焦距(已经知道)。简而言之,上述方程式表示场景中某个点的深度与相应图像点及其相机中心的距离差成反比。因此,利用此信息,我们可以得出图像中所有像素的深度。

因此,它在两个图像之间找到了对应的匹配项。我们已经看到了Epiline约束如何使此操作更快,更准确。一旦找到匹配项,就会发现差异。让我们看看如何使用OpenCV做到这一点。

代码

下面的代码片段显示了创建视差图的简单过程。

import numpy as np

import cv2 as cv

from matplotlib import pyplot as plt

imgL = cv.imread('tsukuba_l.png',0)

imgR = cv.imread('tsukuba_r.png',0)

stereo = cv.StereoBM_create(numDisparities=16, blockSize=15)

disparity = stereo.compute(imgL,imgR)

plt.imshow(disparity,'gray')

plt.show()

下面的图像包含原始图像(左)及其视差图(右)。如你所见,结果受到高度噪声的污染。通过调整numDisparities和blockSize的值,可以获得更好的结果。

当你熟悉StereoBM时,会有一些参数,可能需要微调参数以获得更好,更平滑的结果。参数:

texture_threshold:过滤出纹理不足以进行可靠匹配

区域斑点范围和大小:基于块的匹配器通常会在对象边界附近产生“斑点”,其中匹配窗口捕获一侧的前景和背景 在另一场景中,匹配器似乎还在桌子上投影的纹理中找到小的虚假匹配项。为了消除这些伪像,我们使用由speckle_size和speckle_range参数控制的散斑滤镜对视差图像进行后处理。speckle_size是将视差斑点排除为“斑点”的像素数。speckle_range控制必须将值差异视为同一对象的一部分的程度。

视差数量:滑动窗口的像素数。它越大,可见深度的范围就越大,但是需要更多的计算。

min_disparity:从开始搜索的左像素的x位置开始的偏移量。

uniqueness_ratio:另一个后过滤步骤。如果最佳匹配视差不足够好于搜索范围中的所有其他视差,则将像素滤出。如果texture_threshold和斑点过滤仍在通过虚假匹配,则可以尝试进行调整。

prefilter_size和prefilter_cap:预过滤阶段,可标准化图像亮度并增强纹理,以准备块匹配。通常,你不需要调整这些。

附加资源

Ros stereo img processing wiki page

练习

OpenCV样本包含生成视差图及其3D重建的示例。查看OpenCV-Python示例代码stereo_match.py​​

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
立体校正(Stereo Rectification)是将双目图像中的像素点转换成同一平面上的像素点,以便进行后续的立体匹配。使用Python-OpenCV可以很方便地进行立体校正。下面是一个简单的示例代码: ```python import cv2 # 读取右两张图像 img_left = cv2.imread('left.png') img_right = cv2.imread('right.png') # 读取相机参数 K_left = np.loadtxt('K_left.txt') d_left = np.loadtxt('dist_left.txt') K_right = np.loadtxt('K_right.txt') d_right = np.loadtxt('dist_right.txt') R = np.loadtxt('R.txt') T = np.loadtxt('T.txt') # 计算校正映射 size = img_left.shape[:2][::-1] R1, R2, P1, P2, Q, validPixROI1, validPixROI2 = cv2.stereoRectify(K_left, d_left, K_right, d_right, size, R, T) # 计算校正映射表 map1_left, map2_left = cv2.initUndistortRectifyMap(K_left, d_left, R1, P1, size, cv2.CV_16SC2) map1_right, map2_right = cv2.initUndistortRectifyMap(K_right, d_right, R2, P2, size, cv2.CV_16SC2) # 应用校正映射表,进行立体校正 img_left_rect = cv2.remap(img_left, map1_left, map2_left, cv2.INTER_LINEAR) img_right_rect = cv2.remap(img_right, map1_right, map2_right, cv2.INTER_LINEAR) ``` 在上述代码中,我们首先读取了右两张图像和相机参数,然后使用`cv2.stereoRectify()`函数计算校正映射。该函数的参数包括右相机的内参矩阵、畸变系数、旋转矩阵和平移向量,以及图像大小。校正映射包括右两张图像的旋转矩阵、投影矩阵和视差变换矩阵等信息,可以通过该函数的返回值获取。 接着,我们使用`cv2.initUndistortRectifyMap()`函数计算校正映射表。该函数的参数包括相机的内参矩阵、畸变系数、旋转矩阵、投影矩阵、图像大小和插值方法等。该函数的返回值是两个映射表,可以通过这两个映射表对图像进行校正。 最后,我们使用`cv2.remap()`函数对右两张图像进行校正。该函数的参数包括原图像、映射表和插值方法等。校正后得到的图像可以用于后续的立体匹配
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值